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الفصل الأول: نظرة dale‏ على ذكاء الأعمالء والتحليلات» وعلم البيانات s‏ 


الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, 





تصوير البيانات m‏ 
الفصل الثالث: التحليلات الوصفية (Y)‏ ذكاء الأعمال ومستودعات البيانات a‏ 
الفصل الرابع: التحليلات التنبؤية :)١(‏ عملية وطرق وخوارزميات التنقيب في البيانات. 


الفصل الخامس: التحليلات التنبؤية (Y)‏ تحليلات النص والويب ووسائل 





الفصل السادس: التحليلات التوجيهية: التحسين وا محاكاة ... 





الفصل السابع: مفاهيم وأدوات البيانات الضخمة 





الفصل الثامن: الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في 
التحليلات o‏ 
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نبذة عن المؤلقين 
الفصل الأول: نظرة dole‏ على ذكاء الأعمالء والتحليلات» وعلم البيانات کی 





1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة Iud‏ م وفهم تطبيقات 
التحليلات . 





e بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار والتحليلات‎ ١ 


s تطور دعم القرار المحوسب لعلم البيانات / التحليلات‎ ۴-١ 
إطار عمل ذكاء الأعمال‎ ٤-١ 








حالة عملية :١-١‏ شركة Sabre‏ تساعد ladas‏ من خلال لوحات المعلومات 
والتحليلات . 





استعمال الوسائط المتعددة في ذكاء الأعمال 





0-١‏ نظرة عامة على التحليلات 





حالة عملية :Y-Y‏ 5 4$ سيلفاريس Ee» (Silvaris)‏ أعمالها باستخدام التحليل Johl‏ 
وإمكانيات إعداد التقارير الفورية '———€ 





حالة عملية :"-١‏ شركة سيمنس Js (Siemens)‏ التكلفة باستخدام تصوير البيانات s‏ 


حالة عملية :£-Y‏ تحليل الإصابات الرياضية 





حالة عملية :0-١‏ شركة ستيل بار (Steel Bar)‏ المتخصصة تستخدم التحليلات لتحديد 
تواريخ تنفيذ التزاماتها وفقاً للموارد المتاحة 
5-١‏ أمثلة على التحليلات في مجالات المختارة 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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الموضوع 
١-/ا‏ مقدمة موجزة لتحليلات البيانات الضخمة  TET‏ 





حالة عملية :1-١‏ شركة Center Point‏ للطاقة تستخدم التحليلات الفورية للبيانات 
الضخمة لتحسين خدمة العملاء 
4-١‏ نظرة عامة على النظام البيئي للتحليلات 
9-١‏ خطة الكتاب ... 











٠١-١‏ مواردء وروابطء واتصال شبكة جامعة تیراداتا 





الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية» تصوير 
البيانات ae‏ : 





۲ مقال إفتتاحي: قيام ال 51131015531 بجذب وإشراك جيل جديد من 
مستخدمي الراديو باستخدام التسويق المبني على البيانات 


Y-Y‏ طبيعة البيانات 











حالة عملية :١-۲‏ شركة أجهزة طبية تضمن جودة المنتج مع توفير JUI‏ ... 


٤-۲‏ فن وعلم معالجة البيانات 








حالة عملية Y-Y‏ تحسين الاحتفاظ بالطلاب باستخدام التحليلات المعتمدة على 
البيانات . 





0-7 النمذجة الإحصائية لتحليلات الأعمال 





حالة عملية Y-Y‏ مدينة كاري تستخدم التحليلات لتحليل البيانات من أجهزة 
الاستشعار وتقييم الطلب والكشف عن المشكلات 





5-9 تمذجة الانحدار للإحصاءات الاستدلالية .ا 








ec. tees - NCAA eleg توقع نتائج لعبة‎ :t-Y حالة عملية‎ 


^ ذكاء الأعمال والتحليلات وعلم OLLI‏ منظور إداري 
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V-Y‏ إعداد تقارير الأعمال 





حالة عملية :0-Y‏ انتهاء فيضان الورق E . FEMA à‏ 


m تصوير البيانات‎ A-Y 





حالة عملية ؟-1: ماكفارلان سميث يحسن رؤية الأداء التشغيلي باستخدام Tableau‏ 


... Online 





5-٠‏ الأنواع المختلفة للمخططات والرسوم البيانية 





— — نشأة التحليلات اممرئية‎ ٠١-۲ 





Y‏ اللعلوماك اه هدهب 





حالة عملية ۷-۲: فريق دالاس كاوبويز يحقق نتائج كبيرة مع تابلوه (Tableau)‏ 
وتكنيون (Ieknion)‏ ~ 


حالة عملية :A-Y‏ تساعد التحليلات المرئية مورد الطاقة في عمل روابط أفضل سس 





الفصل الثالث: التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات s‏ 
٠-٣‏ مقال افتتاحي: استهداف الاحتيال الضريبي مع ذكاء الأعمال ومستودعات البيانات .. 


۲-۳ ذكاء الأعمال ومستودعات البيانات 





حالة عملية das :V-Y‏ بيانات أفضل: تستفيد شركات الاتصالات الجيدة التأسيس 
من مستودعات البيانات والتحليلات؛ للبقاء على القمة في صناعة تنافسية san‏ 








m عملية مستودعات البيانات‎ Y-Y 


٤-۳‏ بنيات مستودعات البيانات 








~ (ETL) تكامل البيانات وعمليات الاستخراج والتحويل والتنزيل‎ o-Y 


حالة عملية Y-Y‏ بريتش بتروليوم BP‏ لواد التشحيم تحقق نجاح BIGS‏ ...... 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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Y‏ تطوير مستودع البيانات 
حالة عملية ؟-!:استخدام تحليلات تيراداتالحلول SSAP‏ ع عملية تسليم البيانات الكبيرة 


V-Y‏ قضايا تنفيذ عملية مستودعات البيانات 








حالة عملية EDW :£-Y‏ يساعد على ربط وكالات الدولة في ولاية ميشغان ‏ 


...... إدارة مستودع البياناتء والمشكلات الأمنيةء والاتجاهات المستقبلية‎ A-Y 








۹-۳ إدارة أداء الأعمال 


حالة عملية AARP :0-Y‏ تقوم بتحويل بنية ذكاء الأعمال التحتية وتحقق عائد 
استثمار بنسبة ۳٤۷‏ في ثلاث سنوات حيط 





٠۰-۳‏ مقياس الاداء 





. بطاقات الأداء ا متوازنة‎ ١-۴ 





VY-Y‏ ستة سيجما كنظام لقياس الأداء ‏ الل 





حالة عملية :1-١‏ بطاقة درجة رضا العملاء الخاصة ب Expedia-com‏ 





الفصل الرابع: التحليلات التنبؤية (V)‏ عملية, وطرق» وخوار زميات التنقيب في البيانات.. 


١-٤‏ مقال افتتاحي: قسم شرطة ميامي ديد يستخدم التحليلات التنبؤية للتنبؤ 





۲-٤‏ مفاهيم وتطبيقات التنقيب في البيانات 





حالة عملية Visa :١-6‏ هي تعزيز لتجربة العملاء مع الحد من الاحتيال بالتنقيب 
في البيانات والتحليلات التنبؤية 





حالة عملية 6-؟: احتفاظ شركة 2611 بذكاء وفعالية تحليلاتها في القرن الحادي والعشرين.. 


ecc  تانايبلا تطبيقات التنقيب في‎ Y-t 





E‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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الموضوع 
حالة عملية :Y-t‏ التحليل التنبؤي والتنقيب ف البيانات يساعد في وقف تمويل الإرهاب.. 


٤-٤‏ عملية التنقيب في البيانات 





حالة عملية :٤-٤‏ يساعد التنقيب في البيانات في أبحاث السرطان s‏ 








٥-٤‏ طرق التنقيب في البيانات 
حالة عملية €-0: تستخدم شركة Influence Health‏ التحليلات التنبؤية المتقدمة 
للتركيز على العوامل التي تؤثر بالفعل على قرارات الرعاية الصحية للأشخاص .ب 
5-6 أدوات برمجيات التنقيب في البيانات 22311111 





حالة عملية :1-٤‏ التنقيب في البيانات ينتقل إلى هوليوود: توقع النجاح JUL‏ للأفلام ب 


. مشكلات خصوصية التنقيب في البيانات» والخرافات» والأخطاء الفادحة‎ ۷-٤ 





حالة عملية :۷-٤‏ توقع أماط شراء العملاء - s Target dab‏ 





الفصل الخامس: التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل 
التواصل الاجتماعي ...... 
1-5 مقال افتتاحي: الآلة مقابل الإنسان على Jeopardy‏ قصة واتسون — 
Y-0‏ نظرة عامّة على تحليلات النص والتنقيب في النص _ pnt.‏ 
حالة عملية0-١:‏ مجموعة التأمين تعمل على تقوية إدارة ا مخاطر مع حل التنقيب في النص سس 
Y-0‏ معالجة اللغات الطبيعية (NLP)‏ 














حالة عملية 0-؟: استخدام شبكات AMC‏ التحليلات coded‏ مشاهدين جدد 
وتقييم التوقعات وإضافة القيمة للمعلنين في عام متعدد القنوات m‏ 
0-£ تطبيقات التنقيب في النص 








حالة عملية Y-0‏ التنقيب للكشف عن الأكاذيب 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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الموضوع 
حالة عملية 0-£: إدراج العميل ضمن معادلة الجودة: تستخدم لينوفو Lenovo‏ 
التحليلات من أجل إعادة التفكير في إعادة تصميمها 
0-0 عملية التنقيب في النص 











حالة عملية 0-0: مسح بحوث الأدبيات بالتنقيب في النص ..... 
1-0 تحليل المشاعر ‏ 
حالة عملية 1-0: إنشاء تجربة رقمية فريدة لرصد اللحظات المهمة في وهبلدون سس 











V-0‏ نظرة عامّة على التنقيب في الوييب 


Ls محركات البحٹ‎ A-0 








حالة عملية :V-0‏ فهم لماذا يؤدي التنازل عن عربات التسوق إلى زيادة مبيعات 
بمقدار ٠١‏ مليون دولار e‏ 5 
٥‏ التنقيب في استخدام الويب (تحليلات الويب) 








٠١-5‏ التحليلات الاجتماعية 





حالة عملية :A-0‏ فودكا تيتو تؤسس الولاء للعلامة التجارية بإستراتيجية اجتماعية 





الفصل السادس: التحليلات التوجيهية: التحسين والمحاكاة ... 
١-1١‏ مقال افتتاحي: منطقة فيلاديلفيا التعليمية تستخدم التحليلات التوجيهية 
لإيجاد J>‏ أمثل لإبرام عقود خطوط سير الحافلات 
Y-1‏ اتخاذ القرار SL‏ على النموذج 
حالة عملية :١-5‏ النقل الأمثل للبيانات من الخادم Downstream‏ لشركة إكسون 
موبيل ExxonMobil‏ من خلال نظام دعم القرار DSS‏ 














حالة عملية Y^‏ استخدام تطبيقات ذكاء الأعمال من قبل شركة إنجرام مايكرو 
Ingram Micro‏ من أجل اتخاذ قرارات التسعير . 





w‏ ذكاء الأعمال والتحليلات وعلم OLLI‏ منظور إداري 
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الموضوع 
Y‏ هيكل النماذج الرياضية لدعم القرار 
«sli ٠-1‏ وعدم التأكد والخطر ~ EOIN‏ 








حالة عملية :Y-‏ استخدام الخطوط الجوية الأمريكية نمهذجة التكلفة اللازمة 
لتقييم عدم التأكد من عطاءات طرق الشحن ‏ 


0-1 نمذجة القرار باستخدام جداول البيانات 








حالة عملية -£: استخدام بنسيلفينيا أدو بشن إكسشانج Pennsylvania Adoption)‏ 
(Exchange‏ لنموذج جدول البيانات من أجل تحسين تطابق الأطفال مع الأسر...... 
حالة عملية 0-1: استخدام مؤسسة مترو ميلز أون وييلز تريجر فالي 
(Metro Meals on Wheels Treasure Valley)‏ لبرنامج Excel‏ من أجل البحث 
عن خطوط السير الى للتسليم 
VT‏ تحسين البرمجة الرياضية 
حالة عملية I-T‏ مساعدة موذج البرمجة العددية المختلطة مركز جامعة تينيسي 
Tennessee‏ الطبي في وضع جدول مواعيد الأطباء 
1-/ الأهداف المتعددة وتحليل الحساسية. وتحليل «ماذا - لو» والبحث عن 

















5-1 مقدمة في المحاكاة ... 








حالة عملية :۷-١‏ محاكاة آثار تدخلات الالتهاب الكبدي s B‏ 
حالة عملية :M‏ استخدام شركة كوزان Cosan‏ المحاكاة من أجل تحسين سلسلة التوريد 





٠١-1‏ المحاكاة التفاعلية ا مرئية 





حالة عملية 9-1: تحسين قرارات جدولة محل العمل من خلال الترددات اللاسلكية 
RFID‏ التقييم القائم على المحاكاة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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الموضوع 
الفصل السابع: مفاهيم وأدوات البيانات الضخمة 
۷ مقال افتتاحي: تحليل حركة العملاء في شركة اتصالات باستخدام طرق البيانات 
الضخمة .. 











۲-۷ تعريف البيانات الضخمة 
حالة عملية 1-۷: بيانات بديلة لتحليلات أو توقعات السوق s‏ 





CITES .. أساسيات تحليلات البيانات الضخمة‎ V-V 





حالة عملية :Y-V‏ بنك توب فايف انفستمنت Top Five Investment‏ يحقق 
التوصل إلى مصدر واحد للحقيقة 





٤-۷‏ تقنيات البيانات الضخمة 





حالة عملية :Y-V‏ حل البيانات الضخمة الخاص ب eBay‏ 





حالة عملية :٤-۷‏ فهم جودة ودقة معلومات دعم الرعاية الصحية على تويار ب 





۷- البيانات الضخمة ومس تودعات البيانات 
1-۷ موردو ومنصات البيانات الضخمة . 
حالة عملية :0-V‏ استخدام وسائل التواصل الاجتماعي للتنبؤ الفوري بنشاط الانفلونزا... 
حالة عملية 1-۷: تحليل أنماط المرض من مستودع بيانات السجلات الطبية 
V-V‏ البيانات الضخمة وتحليلات التيار ~ 201130 











A-V‏ تطبيقات تحليلات التيار. 





حالة عملية :V-V‏ استخدام Salesforce‏ لتيار البيانات لتحسين قيمة العميل ىب 
الفصل الثامن: الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات.... 
۱-۸ مقال افتتاحي: تحليل بيانات الاستشعار يساعد سيمنس (Siemens)‏ على 
تجنب أعطال القطارا أ 





n‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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~ إنترنت الأشياء‎ Y-A 
تستخدم تحليل البيانات الفوري‎ SilverHook شركة زوارق‎ :V-A حالة عملية‎ 
لإخطار المتسابقين والمشجعين‎ 
تراقب أصول استكشاف النفط‎ Rockwell Automation شركة‎ :Y-A حالة عملية‎ 
يت‎ £ s. والغاز غالية الثمن‎ 








حالة عملية :Y-A‏ التعاون المشترك بين بيتى باوز Pitney Bowes‏ ومنصة حنرال 
إلكتريك General Electric IoT‏ لتحسين الإنتاج EEE‏ 
Y-A‏ الحوسبة السحابية وتحليلات الأعمال m‏ 
٠-۸‏ التحليلات القائمة على ا موقع بالنسبة للمنظمات 
التحليلات الجغرافية المكانية 














il>‏ عملية Great Clips :£-A‏ تستخدم التحليلات المكانية لتوفير الوقت في قرارات 

















الموقع .ب 3 : 

حالة عملية 0-۸: ستاربكس تستغل نظم المعلومات الجغرافية (GIS)‏ وتحليلاتها 
لتنمو في كل أنحاء العام s‏ 7 

حالة عملية I-A‏ مطعم Quiznos‏ يستهدف عملاء للسندويشات التي يقدمها سس 
0-A‏ القضايا القانونية. والخصوصية, والأخلاقية ~ TN‏ 

5-8 آثار التحليلات في المنظمات: نظرة عامة  c‏ 

وحدات تنظيمية جديدة يي RC‏ يب 

إعادة تصميم المُنظمة من خلال استخدام التحليلات TNR‏ 





أثر التحليلات على أنشطة المديرينء وأدائهم» ورضاهم الوظيفي .... 
V-A‏ عاط البيانات كمهنة .. 
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موجز تمهيدي: 

لقد أصبح تحليل البيانات هو ال منهج الرائد في تقنية العقد الحالي. وتقوم شركات مثل 
أي بي (BM) el‏ وإس إيه بي (SAP)‏ وإس إيه إس (SAS)‏ وتيراداتا (Teradata)‏ وأوراكل 
(Oracle)‏ ومايكروسوفت (Microsoft)‏ ودیل (Dell)‏ وغيرها من الشركات بإنشاء وحدات 
تنظيمية جديدة تركّز على التحليلات التي تساعد الشركات على أن تصبح أكثر فعاليةً وكفاءةً في 
عملياتها. ويستخدم صانعو القرار مزيدًا من الأدوات المحوسبة لدعم أعمالهم؛ بل Ól‏ المستهلكين 
يستخدمون أدوات iles‏ بشكل مباشر أو غير مباشر؛ من أجل اتخاذ قرارات بشأن الأنشطة 
ا معتادة كالتسوق والصحة/ الرعاية الصحية والسقر والترفيه. وقد 13 j$‏ مجالا ذكاء الأعمال 
BI‏ وتحليلات الأعمال BA‏ بسرعة هائلة ليصبحا أكثر تركيرًا على التطبيقات المبتكرة لاستخلاص 
المعلومات من تيارات البيانات التي مم يكن من الممكن الحصولٌ عليها فى وقت ما في الماضي أو كان 
تحليلها على نحو أقل بكثير حتى باستخدام (Sl‏ وسيلة متطورة في هذا الوقت. وتظهر التطبيقات 
الجديدة يوميًا في مجال الرعاية الصحيةء والرياضةء والسغرء والترفيه, وإدارة سلاسل التوريد 
والمرافق» وكل صناعة تقريبًا قد تتخيلها. ومن ثَمّ أصبح مصطلح التحليلات سائدًا وتطوّر بالفعل 
إلى مصطلحات أخرى مثل علم البيانات وهو أحدث تجسيد للتعلّم العميق وإنترنت الأشياء. 

ed isg‏ هذه الطبعة منظورًا إدارياً لتحليل الأعمالء بدءًا من التحليلات الوصفية (مثل: 
طبيعة البيانات» والنمذجة الإحصائية» وتصوير البيانات» وذكاء الأعمال) لينتقل إلى التحليلات 
التنبؤية (مثل: التنقيب في البيانات» والتنقيب في النص/ الويبء والتنقيب في وسائل التواصل 
الاجتماعي)» ومن R‏ إلى التحليلات التوجيهية (مثل: التحسين وا محاكاة) وانتهاءً بالبيانات 
الضخمة. والاتجاهات امس تقبليةء والخصوصية. والاعتبارات الإدارية. ويدعم OLSI‏ موقع 
ويب .(pearsonhighered.com/sharda)‏ وكذلك الموقع المستقل .dssbibook. com‏ كما 
سنوفر روابط إلى برامج تعليمية من خلال قسم خاص لواقع الويب. 

إن الغرض من هذا الكتاب؛ هو تزويد القارئ بهذه التقنيات التي A as‏ عمومًا تحليلات 
الأعمال أو علم البيانات؛ ولكنها كانت معروفةً من قبل بأسماء أخرى. ويعرض هذا الكتاب 
أساسيات الأساليب والطريقة التي يتح من خلالها إنشاء هذه الأنظمة واستخدامها. ونتبع في 
ذلك نهج EEE‏ لتقديم هذه المواضيع: Exposure‏ (التعرض)» Experiences‏ (التجريب)» و 
ا(لاستكشاف). ويوفر الكتابٌ في المقام الأول التعرّض cab‏ أساليب التحليلات 
وتطبيقاتها. والفكرة هي أن الطالب سوف يكون مصدر إلهام لتعلّم كيفية استخدام المنظمات 
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الأخرى للتحليلات؛ من أجل اتخاذ القرارات أو للحصول على ميزة تنافسية. ونعتقد أن مثل 
هذا التعرض با يحدث باستخدام التحليلات وكيفية تحقيقه هو المكون الرئيس للتعلم بشأن 
التحليلات. ds‏ وَصْف الأساليب» نعرض كذلك أدوات البرمجيات المحدّدة التي يمكن استخدامها 
لتطوير مثل هذه التطبيقات. ولا يقتصر الكتاب على أداة برمجية واحدة. حتى يستطيع الطالب 
تجريب هذه الأماليب باستخدام sae (el‏ من أدوات البرمجيات المتاحة. كما نقدّم اقتراحات 
مُحدَّدة في US‏ فصل حتى يتسنى للطالب والأستاذ استخدامٌ هذا الكتاب الذي يحتوي على 
العديد من أدوات البرمجيات المختلفة. وسيتضمّن موقع الويب المصاحب LLY‏ أدلة لبرمجيات 
محددة. ولكن هكن للطلاب اكتساث الخبرة في هذه الأساليب بطرق عديدة ومختلفة. وأخيرا؛ 
نأمل أن كن JS‏ من التعرض والتجريب» ويحفزا القراء على استكشاف إمكانات هذه الأساليب 
كل في مجاله. ولتسهيل مثل هذا الاستكشاف؛ نقوم بتضمين التجارب التي توجههم إلى شبكة 
جامعة تيراداتا Teradata‏ وغيرها من المواقع؛ والتي تشمل تدريبات à‏ على عمل الفريق 
إذا لزم الأمر. Bl ous‏ الضوء أيضاً على التطبيقات الجديدة والمبتكرة التي نتعلمها على موقع 
الكتاب على شبكة الإنترنت. 

وتركز معظم التحسينات المحدّدة التي أدخلّت في هذه الطبعة الرابعة على أربعة مجالات 
هي: إعادة التنظيم» والفصول الجديدة وتحديث المحتوىء وتركيز أكثر وضوحاً. وعلى الرغم من 
التغييرات العديدة؛ فقد حافظنا على الشمولية وسهولة الاستخدام التي جعلت الكتاب من الكتب 
الرائدة في السوق. وأخيرًا؛ نقدم موادًا دقيقةً Sanog‏ غير متوفرة في أي نص آخر. 


ما الجديدٌ في الطبعة الرابعة؟ 


ولأننا نهدف إلى تحسين النص؛ قمنا في هذه الطبعة بإعادة تنظيم جوهرية للنص S3‏ 
من خلالها على تحليلات الأعمال. وقد تم تنظيمٌ هذه الطبعة لتتضمن ثلاثة أنواع رئيسة من 
تحليلات الأعمال (وهي: الوصفية» والتنبؤية» والتوجيهية). وتحتوي الطبعة الجديدة على العديد 
من الإضافات التي تتناسب مع التطورات الحديثة. وقد $3 حذف المحتويات التي أصبحت Y‏ 
تتلاءم مع هذه التطؤرات. وقد أجريّت التغييرات الرئيسية التالية: 
- التنظيم الجديد: 3o‏ هذا الكتابٌ بثلاثة أنواع من التحليلات: الوصفية, والتنبؤية» والتوجيهية؛ 

وهو التصنيف الذي يروّج له معهدٌ بحوث العمليات وإدارة العلوم إنفورمز (INFORMS)‏ 
edd‏ الفصل الأول ذكاء الأعمال والتحليل مع التركيز على تطبيقاتهما في العديد من الصناعات. 
كما يتضمّن هذا الفصل كذلك dele ah‏ عن النظام البيئي للتحليل لمساعدة المستخدم على 
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استكشاف جميع الطرق المختلفة التي هكن المشاركة فيها وتنميتها في بيئة التحليلات. ويلي 

ذلك نظرةٌ dale‏ على الإحصاءات وأهمية البيانات والتحليلات الوصفية/ التصوير في الفصل 

الثاني. ويتناول الفصل الثالث مستودع البيانات ua olo‏ البيانات ها في ذلك المحتوى sedi‏ 

وخصوصًا بحيرات البيانات. ويغطي Lail‏ الرابع التحليلات التنبؤية. UST‏ الفصل الخامس 

فيوس ع من نطاق تطبيق التحليلات إلى النص وا مواقع الإلكترونية ووسائل التواصل الاجتماعي. 

ويتناول الفصل السادس التحليلات التوجيهية؛ وخاصة البرمجة الخطية والمحاكاة. وهو محتوى 

جديد UL‏ بهذا الكتاب. ويقدّم الفصل السابع أدوات oL ias‏ البيانات الضخمة. ويُختتم 

الكتابٌ بالفصل الثامن والاتجاهات والمواضيع الحديثة الظهور في تحليلات الأعمال بما في ذلك 

تحليلات qued‏ وإنترنت الأشياء والاعتبارات الخصوصية/ الأخلاقية في التحليلات. وتعترف 

مناقشة النظام البيئي التحليلي بالتحليلات التوجيهية كذلك. 

- الفصول الجديدة: cuz.‏ إضافة الفصول التالية: 

- الفصل الثاني: التحليلات الوصفية à sudo :)١(‏ البيانات» النمذجة الإحصائيةء وتصوير 
البيانات ويهدف هذا daill‏ إلى وضع حجر الأساس للدراسة التحليلية عن طريق فهم 
شامل لطبيعة البيانات» وهو العنصرٌ الرئيس GY‏ دراسة تحليلية. ويلي «DS‏ عرض 
النمذجة الإحصائية كجزء من التحليلات الوصفية. ولقد أصبح تصويرٌ البيانات جزءًا 
شائعًا من أي تقرير عن الأعمال و / أو أي مشروع تحليلي وصفي؛ وبالتالي نقوم بشرح 
ذلك بالتفصيل في هذا الفصل. ونع زز الفصل بالعديد من الحالات والأمثلة في عام 
الواقع ZO)‏ من المواد الجديدة). 

- الفصل السادس: التحليلات التوجيهية: التحسين وا محاكاة. ويقدّم هذا الفصل Šola‏ 
slos‏ وصفيةٌ لهذا الكتاب. ويركٌز الفصل على نمذجة التحسين في إكسيل باستخدام 
تقنيات البرمجة الخطية. كما eds‏ مفهوم المحاكاة. والفصل هو نسخةٌ محدثة مواد 
فصلين في كتابنا DSS‏ الطبعة العاشرة. وهو بالنسبة لهذا الكتاب aab‏ جديدٌ تمامًا 
)439 مواد جديدة). 

- الفصل الثامن: الاتجاهات المستقبلية, والخصوصية: والاعتبارات الإدارية ف التحليلات 
ويتناول هذا daill‏ العديد من الظواهر الجديدة التي تغيّر أو من المحتمل أن تغير 
التحليلات. حيث يتناول تحليلات الجغرافيا المكانيةء وإنترنت الأشياء وتحدينًا Dus‏ 
للمواد المتعلقة بالتحليلات المستندة إلى الحوسبة السحابية. كما يقوم بتحديث 
ما تناولته الطبعة الأخيرة glis‏ الاعتبارات الأخلاقية والعملية ZV)‏ مواد جديدة). 
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- الفصول المنقحة: وقد تمّ Guin‏ جميع الفصول الأخرى وتحديثها كذلك. وفيما يلي Jaida‏ 
للتغيرات في هذه الفصول الأخرى: 
- الفصل الأول: نظرة عامة على ذكاء الأعمالء والتحليلات» وعلم البيانات: تمت إعادة كتابة 
هذا الفصل وتوسعته بشكل كبير؛ بحيث يُفتتح بمقالة قصيرة جديدة تغطي تطبيقات 
متعددة من التحليلات في مجال الرياضة. وهو يقدّم الأنواع الثلاثة من التحليلات على 
النحو الذي اقترحته مؤسسة إنفورمز (INFORMS)‏ التحليلات الوصفية. التنبؤية, 
والتوجيهية. وكما أشرنا سابقاً؛ فإن هذا التصنيف eon a‏ في التوجيه لإعادة تنظيم 
كاملة للكتاب نفسه (المحتوى السابق؛ ولكن بشكلٍ جديد). ثم يتضمن عدة أمثلة 
جديدة من التحليلات في مجال الرعاية الصحية وفي قطاع تجارة التجزئة. fols‏ فإنه 
يُختتم بتغطية مُوسّعة Sos‏ بشكلٍ كبير للنظام البيئي للتحليلات gab‏ الطلاب Dos‏ 
باتساع نطاق صناعة التحليلات وعلم البيانات (حوالي XT‏ مواد جديدة). 
- الفصل الثالث: التحليلات الوصفية (۲): ذكاء الأعمال ومستودع البيانات: ig‏ هذا 
الفصل فصلا Gua‏ أضيف إليه بعص الأقسام الفرعية الجديدة (مثل: بحيرات البيانات) 
وحالات جديدة (حوالي ZY-‏ مواد جديدة). 
- الفصل الرابع: التحليلات التنبؤية :)١(‏ عمليةء وطرقء وخوارزميات التنقيب في 
لبيانات» وهذا أيضاً فصلٌ قديمٌ مع تنظيم/ تدفق جديد للمحتوى وبعض الحالات 
الجديدة (حوالي XY-‏ مواد جديدة). 
- الفصل الخامس: التحليلات التنبؤية (؟): تحليلات النص» والويب» ووسائل التواصل 
لاجتماعي وهو فصل قديم مع تنظيم/ تدفق جديد للمحتوى وبعض الحالات الجديدة 
(حوالي YO‏ مواد جديدة). 
- الفصل السابع: مفاهيم وأدوات البيانات الضخمة: كان هذا الفصل هو الفصل 
السادس في الطبعة السابقة. وقد تمّ تحديثه بمقدمة افتتاحية مختصرة وحالات 
Ga ado‏ وتغطية لتيراداتا أستر algas (Teradata Aster)‏ جديدة تتعلق بالبيانات 
البديلة (حوالي XYO‏ مادة جديدة). 





- فريق تأليف مجدد: استنادً! إلى المحتوى المتميز الذي قام بإعداده مؤلفو الطبعات السابقة 
(Kings Deleng Shardas Turban)‏ قام بتنقيح هذه الطبعة js‏ من Ramesh Sharda‏ 
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Dursun Deleng‏ وقد عمل الأخيران على نطاق واسع في التحليلات بما لهما من كفاءة 
في المجال الصناعي فضلاً عن الخبرة البحثية. 
- طباعة ملونة: إننا سعداء حقاً أن يظهر هذا الكتاب بالألوان. وحتى الأشكال التي وردت في 
النسخ السابقة أعيد رسمها حتى تتمتع بميزة الألوان. إن استخدام اللون jia‏ العديد من 
الأمثلة التصويرية والمواد الأخرى كذلك. 
- موقع ويب مُحدَّتْ ونشط: يكن لقراء هذا الكتاب الآن الوصول إلى موقع على شبكة الإنترنت 
يشتمل على روابط خاصة بالأخبارء والبرمجيات. والبرامج التعليمية. وحتى مقاطع فيديو يوتيوب 
ذات الصلة بالمواضيع التي يغطيها الكتاب. liag‏ الموقع سوف يكون lla‏ في -dssbibook.com‏ 
- محتوى مُتقّح ومُحدَّتْ: لقد استهللنا جميع الفصول تقريبًا مقدمات تستند على القصص والأحداث 
الجارية. وبالإضافة إلى ذلك؛ تمّ تحديث الحالات العملية في جميع فصول الكتاب لتشمل الأمثلة 
الحديثة لتطبيقات أساليب/ نماذج معينة. وقد تمت إضافة روابط موقع ويب جديدة في جميع 
فصول الكتاب. كما حذفنا العديد من الروابط وا مراجع القديمة. وأخيراً؛ فقد أوردنا في معظم 
الفصول تدريبات ومهام جديدة على الإنترنت» وأسئلة مناقشة في جميع فصول الكتاب. 
- روابط إلى شبكة جامعة تيراداتا (TUN)‏ وتتضمن معظم الفصول روابط جديدة إلى شبكة 
جامعة تيراداتا -(teradatauniversitynetwork.com)‏ 
- عنوان الكتاب: وكما هو واضح بالفعل؛ فقد تغير عنوان الكتاب وتركيزه بشكل كبير. 
- دعم البرمجيات: يوفر موقع TUN‏ على شبكة الإنترنت دعم البرمجيات دون (Sl‏ رسوم. كما 
يوفر روابط إلى التنقيب في البيانات مجانًا وغيرها من البرامج. وبالإضافة إلى EUS‏ يوفر الموقع 
تدريبات على استخدام مثل هذه البرامج. 
- الباقة الإضافية :www.pearsonhighered.com/sharda‏ هي مجموعة شاملة ومرنة من 
الدعم التقني لتعزيز تجربة التعليم والتعلم. كما تتوفّر المواد الإضافية لكل من الطالب 
والمدرب على موقع الكتاب الإلكتروني» :pearsonhighered.com/sharda‏ 
-١‏ دليل المدرب: يتضمّن alo‏ المدرب أهداف «a JS pedl‏ واقتراحات التدريس 
Le)‏ في ذلك تعليمات للمشاريع). ويتوفر دليل المدرب في قسم هيئة التدريس في 
-pearsonhighered.com/sharda‏ 
-Y‏ ملف بند الاختبار وبرنامج ITestGen‏ إن ملف بند الاختبار عبارة عن مجموعة 
شاملة من أسئلة (lhs / guo)‏ وأسئلة الاختيار ا متعدد Sls‏ الفراغ وأسئلة مقالية. 
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موجز تمهيدي 


ويتم تصنيف الأسئلة حسب مستوى الصعوبةء ويُشار إلى الإجابات برقم صفحة الكتاب 
التي توجد بها. ويتوفّر ملف بند الاختبار في -TestGeng Microsoft Word‏ ويتوفر 
برنامج توليد اختبار Pearson Education‏ من www.pearsonhighered.com/‏ 
irc‏ ويتوافق البرنامج مع dS‏ من الحاسب الشخصي وأجهزة Rig MAC‏ تنزيله مع 
جميع أسئلة ملف بند الاختبار. ويمكنك أن تقوم يدوياً أو عشوائياً بعرض أسئلة الاختبار 
والسحب والإسقاط لإنشاء اختبار. ويمكنك إضافة أو تعديل أسئلة بنك الاختبار حسب 
الحاجة. ويتم تحويل برمجية TestGens‏ حتى يمكن استخدامها في ds‏ من BlackBoard‏ 
.Angelg D2Ls Moodles WebCT 9‏ ويمكن العثور على هذه النسخ على موقع 
.pearsonhighered.com/sharda‏ كما يتوفر TestGen eb‏ في Respond us‏ ومكن 
الاطلاع على -www.respondus.com‏ 

-Y‏ شرائح باوربوينت: تتوفر شرائح باوربوينت التي تنميز بخاصية الإضاءة؛ la‏ على 
المفاهيم الأساسية في النص. ويمكن لأعضاء هيئة التدريس تنزيل شرائح باوربوينت من 
.pearsonhighered.com/sharda‏ 


شكر وتقدير: 

قدّم العديدٌ من الأفراد اقتراحات وانتقادات منذ نشر الطبعة الأولى من هذا الكتاب. وقد 
شارك العشراتٌ من الطلاب في الاختبارات الصفية ممختلف الفصول والبرامج والمشكلات وساعدوا 
في جمع المواد. ولا هكن ذكر اسم US‏ من شارك في هذا المشروع؛ ولكننا abo‏ الشكر لهم جميعاً. 
كما pás‏ البعض مساهمات SS‏ هؤلاء يستحقون تقديراً خاصًا. 

ai Mal‏ جهود الأفراد الذين قاموا بمراجعات رسمية للطبعات من الأولى حتى الثالثة 
(الانتماءات المدرسية اعتباراً من تاريخ المراجعة): 
- آن أكسوت» كلية مجتمع بيدمونت المركزية. 
- باي أرينز جامعة دريكسل. 
- أندي بورشرز» جامعة ليبسكومب. 
- رائجيت بوس» جامعة نيو مكسيكو. 
Nus S dla -‏ جامعة أمريكا الوسطى الناصرية. 
- كورت إنجمان» كلية أيونا. 
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di موجز‎ 


- بديع فرح» جامعة ميشيغان الشرقية. 
- غاري فارار» كلية كولومبيا. 
- جيري فيرميستادء معهد نيو جيرسي للتكنولوجيا. 
- كريستي م. فولرء جامعة لويزيانا التقنية. 
- مارتن غروسمان» كلية بريدج ووتر الحكومية. 
- جهانكير کرهي» جامعة کولورادوء دنفر. 
- هوي لي» جامعة ميشيغان الشرقية. 
- ناتالي نازارينكو. جامعة نيويورك فريدونيا الحكومية. 
- جو إنج لي بارتريدج» جامعة كونيتيكت الحكومية المركزية. 
- غريغوري روزء جامعة واشنطن الحكوميةء فانكوفر. 
- خواجة سعيد جامعة ويتشيتا الحكومية. 
YS -‏ تشاند «Jos‏ جامعة لويولا ماريماونت. 
- جوشوا س. وايت» دكتوراه» جامعة نيويورك الحكومية معهد الفنون التطبيقية. 
- روجر ويلسونء جامعة فيرمونت الحكومية. 
- فنسنت يوء جامعة ميسوري للعلوم والتكنولوجيا. 
- فان تشاوء جامعة ساحل خليج فلوريدا. 

js‏ أيضاً جهود الأفراد الذين قاموا مراجعات رسمية لهذا النص وكتابنا الآخر DSS‏ - ذكاء 
الأعمال والتحليلات: نظم دعم اتخاذ القرارء الطبعة العاشرة. بيرسون للتعليم, PVY‏ 

ثانياً أسهم العديدٌُ من الأفراد مواد في النص أو المواد الداعمة. وقد قذّمت سوزان باسكن 
من تيراداتا والدكتور ديفيد شريدر مساعدةٌ خاصة في تحديد المحتوى الجديد JS‏ من TUN‏ 
وتيراداتا للكتاب وترتيب الأذونات لنفس الغرض. كما أسهم الدكتور ديف شريدر في افتتاح 
المقالة القصيرة للكتاب. تضمّنت هذه المقالة القصيرة أيضاً مواد طوّرها الدكتور أشيش جوبتا 
من جامعة أوبورن وجاري ويلكيرسون من جامعة تينيسي تشاتانوجا. وسوف توفر مقدمة 
رائعة للتحليلات. نشكر أيضاً INFORMS‏ على إذنهم بتسليط الضوء على المحتوى من 
الواجهات. كما نعترف بدور الأفراد التالية أسماؤهم في المساعدة في تطوير هذا الإصدار من 
الکتاب؛ وهم: بانكوش كالجوتراء وبراسون ماثورء وروبيش آجاروال» وشوبهام giw‏ ونان ليانغ» 
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موجز تمهيدي 


وجاكوب بيرسونء وكينزي كليميرء وإيفان مورليت (وجميعهم من جامعة أوكلاهوما الحكومية). 
وقد قام فريق ‘sleg «Teradata Aster‏ مارك أووت بتوفير المواد اللازمة للمقالة الافتتاحية 
للفصل السابع. إذ يتم تكييف مواد Aster‏ في الفصل V‏ من أدلة التدريب الأخرى التي طوّرها 
جون ثوما وجريج بيثاردي. كما قاد الدكتور برايان ليكلاير. مدير قسم المعلومات في شركة 
8 بمساهمات من العديد من دراسات الحالة الصحية الواقعية التي طوّرها فريقه في 
.Humana‏ وأسهم ابهيشيك dl;‏ من vCreaTek‏ برؤيته للتحليلات في diro‏ بيع التجزئة. 
كما نتوجه بالشكر والتقدير للدكتور ريك ويلسون على التدريبات الممتازة لتدريس وممارسة 
مهارات البرمجة الخطية في Excel‏ كما سمح L‏ مات تارك بتكييف مواد النظام البيئي لإنترنت 
الأشياء الخاصة به. ويقرٌ راميش بالمساعدة التي قدَّمتها ابنته» رشي شاردا سن في تحرير النسخ. 
بالإضافة إلى ذلك؛ Ao eds‏ الدكتوراه وزملاؤنا من الباحثين التالي أسماؤهم محتوّى أو نصيحةٌ 
ودعمًا للكتاب بعدة طرق مباشرة وغير مباشرة: 
- أسيل أوزتيكينء جامعة ماساتشوستس - لويل. 
- إيئيس إريارسويء جامعة سيهير. 
- حامد مجيدي زولبانين» جامعة بول الحكومية. 
- أمير حسن cool)‏ جامعة رايت الحكومية. 
- سوبافيتش (فون) بنجنات» جامعة داكوتا الشمالية الحكومية. 
- كريستي فولر, جامعة بويز الحكومية. 
- دانييل أسامواه. جامعة رايت الحكومية. 
- سليم col)‏ جامعة إسطنبول الفنية. 
- نيهات كاساب» جامعة سابانسي. 

ثالث بالنسبة للنسخة السابقة» نقر بمساهمات ديفيد كينج .(DA Software Group, Inc.)‏ 
ومن بين المساهمين الأساسيين الآخرين في الإصدار السابق جي أرونسون (جامعة جورجيا)» والذي 
كان مؤلقًا مشارگاء والمساهم في فصل مستودعات البيانات؛ ومايك جول (جامعة أريزونا الحكومية» 
والتي تم hol‏ إسهاماتها في الفصل ١؛‏ وكذلك تي بي ليانج (جامعة صن - يت سنء تايوان)» والذي 
أسهم هواد حول الشبكات العصبية في الإصدارات السابقة. كما تعاونت جودي لانج معنا جميعًا في 
توفير التحريرء وقادتنا خلال المشروع بأكمله في الإصدار الأول. 


vé‏ ذكاء الأعمال والتحليلات وعلم «LI‏ منظور إداري 


موجز تمهيدي 


sul;‏ تعاون العديدٌ من الموردين من خلال توفير دراسات الحالة و / أو برمجيات العرض 
التوضيحي للإصدارات السابقة وهم: أكسيوم (ليتل edo y‏ أركنساس)ء برمجيات كاليفورنيا العلمية 
(نيفادا سيتيء کالیفورنیا)» كاري هاروين من تطوير كاتاليست (يوكا فالي» كاليفورنيا)» آي بي el‏ 
(سان کارلوس» كاليفورنيا)» شركة دي إس جروب» (جرينيتش» كونيكتيكت)» جريجوري بياتيتسكي 
شابيرو من -KDnuggets.com‏ جاري لين من .NeuroDimension Inc‏ (جاينيسفيلء فلوريدا)» 
برمجيات باليساد (نیوفیلد. نيويورك)» برومیسد لاند للتقنيات (نيو هافن» کونیکتیکت) نظم 
سالفورد Y)‏ جولاء كاليفورنيا)» سينس الشبكات (نيويورك» نيويورك)» جاري ماينر من شركة ستات 
سوفت» (تولساء أوكلاهوما)» شركة وارد سيس ja‏ جروب» إنك (فريدريكء ميريلاند)» شركة نظم 
آيديا فيشرء (إيرفينجء کالیفورنیا)» ونظم ورد تك (أورينداء كاليفورنيا). 

خامساً شكرٌ خاص لشبكة جامعة تيراداتا وخاصة سوزان باسكنء مديرة البرنامج؛ وهيوج 
واتسون الذي أسّس شبكة جامعة تيراداتاء ومايكل جول» وبارب ويكسوم؛ وماري جروس على 
تشجيعهم لنا على ربط هذا الكتاب بشبكة جامعة تيراداتا وتوفير مواد مفيدة له. 

أخيراً؛ نثني على فريق بيرسون: سامانتا لويس» التي عملت معنا على هذه المراجعة وقامت 
بتنظيم الإخراج الملون للكتاب؛ وفريق الإنتاج» آن بوليدى وريفاتي فيس واناثان والموظفون في 
سينفيوء الذين حؤّلوا المخطوطة اليدوية إلى كتاب. 


39 أن نشكر [S‏ هؤلاء الأفراد والشركات. فبدون مساعدتهم U‏ كان إنشاء هذا الكتاب ممكنًا. 


راميش شاردا 
دورسون ديلن 
إفرايم توربان 


* لاحظ ól‏ روابط موقع الويب ديناميكية؛ فبمجرد مثول هذا الكتاب للطباعةء تم التحقق من Ol‏ جميع 
مواقع الويب المذكورة نش طة وصالحة. ولكن في بعض الأحيان تتغير أو تقف مواقع الويب ا مشار إليها في النص 
بسبب تغيير الشركات لأسمائهاء أو قد يتم شراؤها أو بيعها أو دمجها أو فشلهاء ds‏ أحيان أخرى تكون مواقع 
الويب معطلةً للصيانة أو الإصلاح أو إعادة التصميم. وفي حين Si‏ معظم المنظمات قد أسقطت البادئة «www»‏ 
من مواقعها؛ فإنَّ البعض الآخر لا يزال يستخدمها. إذا واجهت مشكلة في الاتصال بموقع ويب تم الإشارة إليهء 
فضلاً os‏ بالصبر وقم ببساطة بتشغيل بحث الويب ممحاولة تحديد الموقع الجديد؛ إذ إنه في معظم الأوقات يمكن 
Std‏ على الموقع الجديد بسرعة. نعتذر مقدماً عن هذا الإزعاج. 
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ذكاء الأعمالء والتحليلات» وعلم البيانات - منظور إداري: 


يتناول هذا الكتاب مجموعة من تقنيات الحاسب التي تدعم العمل الإداري؛ وبشكل أساسي 
صنع القرار. وقد كان لهذه التقنيات أثر عميق على إستراتيجية الشركة وأدائها وقدرتها التنافسية. 
وتُسمى هذه التقنيات razao‏ ذكاء الأعمال وتحليلات الأعمال وعلم البيانات. وعلى الرغم من 
مناقشة تطور المصطلحات, يتم استخدام هذه الأسماء أيضاً بالتبادل. ويروي هذا الكتاب Laa‏ 
عن كيفية توظيف الأفراد الأذكياء لهذه التقنيات لتحسين الأداء والخدمة والعلاقات في الأعمال 
والحكومات والعوام غير الربحية. 
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TV 


ثُبذة عن المؤلفين: 

- راميش شاردا :Ramesh Sharda‏ (حاصل على درجة ماجستير إدارة الأعمالء والدكتورام 
من جامعة ويسكونسن - ماديسون)» وهو نائب العميد لبرامج البحث والخريجين» وعضو في 
واتسون / كونوكوفيليبس» وأستاذ أعضاء مجلس الجامعة للعلوم الإدارية ونظم امعلومات 
في مدرسة سبيرز للأعمال بجامعة أوكلاهوما الحكومية (OSU)‏ قام بالتأسيس والإشراف 
على درجة الدكتوراه في إدارة الأعمال في برنامج مديري التنفيذ. وقد تمّ نشرٌ حوالي ٠٠١‏ 
ورقة تصف أبحاثه في كبرى ال مجلات» ما في ذلك بحوث العمليات» وعلم الإدارة وبحوث 
نظم المعلومات» ونظم دعم القرارء ومجلة نظم المعلومات الإدارية. كما قام بتأسيس AIS‏ 
© على أنظمة دعم القرار وإدارة المعرفة (SIGDSA)‏ يعمل الدكتور شاردا في العديد 
من مجالس التحريرء Le‏ في ذلك مجلة علوم القرارء ونظم دعم القرارء وقاعدة بيانات 
ACM‏ قام بتأليف وتحرير العديد من الكتب النصية والكتب البحثيةء كما يشارك في 
تحرير العديد من كتب سلسلة Springer‏ (وهي سلسلة متكاملة في نظم المعلومات» 
وواجهات بحوث العمليات/ علوم الحاسب» وسجلات نظم المعلومات). ويشغل حالياً 
منصب المدير التنفيذي لشبكة جامعة تيراداتا. وتتمثل اهتماماته البحثية الحالية في نظم 
دعم القرار وتحليلات الأعمال وتقنيات إدارة الحمل الزائد للمعلومات. 

- دورسون ديلن :Dursun Delen‏ (حاصلٌ على درجة الدكتوراه» من جامعة أوكلاهوما 
الحكومية) وهو عضو سبيرز إندويد في إدارة الأعمالء وعضو في مؤسسة باترسون في 
تحليلات الأعمال» ومدير أبحاث مركز تعاون النظم الصحية» وأستاذ أعضاء مجلس الجامعة 
للعلوم الإدارية ونظم المعلومات في مدرسة سبيرز للأعمال بجامعة أوكلاهوما الحكومية 
(OSU)‏ وقد عمل قبل مسيرته الأكادهية ble‏ أبحاث لمدة 0 سنوات» في شركة خاصة 
للأبحاث والاستشارات« وهى شركة «Knowledge Based Systems‏ في College Station‏ 
بولاية تكساس.ء وقد قاد خلال تلك الفترة عدداً من نظم دعم القرار ونظم المعلومات 
الأخرىء ومشاريع البحوث ذات الصّلة التي Bae uS‏ وكالات فيدرالية: Jia‏ وزارة 
الدفاع (DoD)‏ وإدارة الطيران والفضاء الوطنية (NASA)‏ وامعهد الوطني للمعايير 
والتقنية (NIST)‏ ومنظمة دفاع القذائف البالستية (BMDO)‏ ووزارة الطاقة (DOE)‏ 
نشر الدكتور ديلن أكثر من ٠٠١‏ مقالة استعرضها الزملاء وقد ظهر بعضها في كبرى 
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بذة عن المؤلفين 


المجلات مثل علوم hAl‏ وأنظمة دعم اتخاذ القرارء واتصالات ACM‏ وبحوث الحاسب 
والعمليات» وأجهزة الحاسب في الصناعةء ومجلة إدارة عمليات الإنتاج. والذكاء الاصطناعي 
في a. JI‏ والمجلة الدولية للمعلوماتية الطبية. والأنظمة الخبيرة مع التطبيقات» والاتصالات 
اللاسلكية IEEE‏ وقام مؤخراً بتأليف / المشاركة في تأليف سبعة كتب نصية في مجالات 
ds ul‏ النطاق من تحليلات الأعمالء والتنقيب في البيانات» والتنقيب في النص» وذكاء 
الأعمالء وأنظمة دعم القرار. وغالباً ما يُدعى للمشاركة في المؤتمرات الوطنية والدولية 
لعناوين رئيسة عن موضوعات ذات صلة بالتنقيب في البيانات/ النص وتحليلات الأعمال 
ونظم دعم القرار وذكاء الأعمال وإدارة المعرفة. شغل منصب مساعد الرئيس العام 
للمؤتمر الدولي الرابع للحوسبة الشبكية وإدارة ا معلومات المتقدمة ٤-۲(‏ سبتمبر EYA‏ 
في سيولء كوريا الجنوبية) ويشارك بانتظام في رئاسة وتسيير أعمال مختلف مؤتمرات نظم 
المعلومات والمؤتمرات التحليلية. يشغل Lilo‏ منصب رئيس التحريرء محرر «Jgl‏ محرر 
مشاركء أو عضو في هيئة تحرير لأكثر من عشرة مجلات أكادهية. ويعمل حاليًا رئيس 
تحريرء أو محرر «lol‏ أو محرر مشاركء أو عضو مجلس تحرير لأكثر من اثنتي عشرة مجلة 
أكادهية. وتتمثل اهتماماته البحثية والتعليمية في التنقيب في البيانات والنص» وتحليلات 
الأعمال» ونظم دعم القرارء وإدارة المعرفة» وذكاء الأعمالء ونمذجة المؤسسات. 

- إفرايم توربان :Efraim Turban‏ (حاصل على درجة ماجستير إدارة الأعمالء والدكتورام 
من جامعة كاليفورنياء بولاية بيركلي) وهو باحث زائر في معهد الباسيفيك لإدارة نظم 
المعلومات» بجامعة هاواي. وعمل قبل ذلك في العديد من الجامعات» مثل: جامعة سيتي 
في هونغ igs‏ وجامعة لي aslo‏ وجامعة فلوريدا الدوليةء وجامعة كاليفورنيا daas Sedi‏ 
ولونج بيتش» وجامعة إلينوي الشرقيةء وجامعة كاليفورنيا الجنوبية. وقد قام الدكتور 
توربان بتأليف أكثر من ٠٠١‏ ورقة محكمة تم نشرها في المجلات الرائدة مثل: علوم 
الإدارةء ونظم المعلومات الإدارية الفصلية. ودعم اتخاذ القرار. كما لف oS ٠١‏ مثل 
التجارة الإلكترونية: منظور إداري وتقنية المعلومات للإدارة. وهو أيضاً مستشارٌ لكبرى 
الشركات في جميع أنحاء العالم. وتتمثل مجالات اهتمام د. توربان الحالية في نظم دعم 
القرار على شبكة الإنترنت» والتجارة الاجتماعية» وصنع القرار بشكل تعاوني. 


YA‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


الفصل الأول 
نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


أهداف التعلّم: 
- فهم الحاجة إلى الدعم المحوسب لصنع القرار الإداري. 
- التعرّف على تطوّر مثل هذا الدعم المحوسب للحالة الراهنة - ede‏ التحليلات / البيانات. 
- وصف منهجية ومفاهيم ذكاء الأعمال. 
- فهم أنواع مختلفة من التحليلات» والاطلاع على تطبيقات مختارة. 
- فهم النظام البيئي للتحليلات لتحديد اللاعبين الأساسيين المتنوعين والفرص الوظيفية. 
إنَّ بيئة الأعمال (مناخ الأعمال) تنغير باستمرار حتى أصبحت أكثر تعقيدًا. وتخضع المنظمات, 
سواءً العامة أو الخاصةء لضغوط تجبرها على سرعة الاستجابة للظروف المتغيرة وأن تكون مبتكرة في 
طريقة عملها. وتتطلب هذه الأنشطة من المنظمات أن تكون a‏ وأن تتخذ قرارات إستراتيجية 
وتكتيكية وتشغيلية متكررة de wg‏ بعضها معقد جداً. اتخاذ مثل هذه القرارات يتطلب كميات 
كبيرة من البيانات والمعلومات وا معارف المرتبطة بالموضوع» والتي يجب أن تتم معالجتها في كثير 
من الأحيان وفق إِطارٍ معين وبشكلٍ عاجل وسريع Bale‏ مايتطلب بعض الدعم المحوسب. 
Jobs‏ هذا الكتابُ استخدام تحليلات الأعمال كدعم محوسب لاتخاذ القرارات الإدارية, 
Sig‏ على أسس ونظريات دعم القرارء وكذلك على الأدوات والتقنيات التجارية ا متاحةء pág‏ 
هذا الكتاب أساسيات تلك التقنيات وطرق بناء الأنظمة واس تخدامها. ونتبع في ذلك نهج EEE‏ 
لتقديم هذه المواضيع: Experiences {yb el) Exposure‏ (التجريب). Exploration‏ 
(الاستكشاف). ويقدّم هذا الكتاب بشكلٍ أساسي استكشاف تقنيات التحليل المختلفة وتطبيقاتها؛ 
لتصبح مصدر إلهام للطالب لتعلم كيفية استخدام المنظمات لتلك التحليلات في اتخاذ قرارات 
أو ميزات تنافسية. ونعتقد أن هذا التعرّض ما يحدث باستخدام التحليلات ونتائجها هو مكون 
رئيس eld‏ تلك التحليلات. لوصف تلك التقنيات سنقدم Alta]‏ لأدوات برمجية مُحدّدة بالإمكان 
استخدامها لتطوير هذه التطبيقات. وفي وصف الأساليبء نعرض كذلك أدوات البرمجيات 
المحددة التي يمكن استخدامها لتطوير مثل هذه التطبيقات. ولا يقتصر الكتاب على أداة برمجية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Ys‏ 


الفصل الأول 


واحدة حتى يتمكّن الطالب من تجريب هذه التقنيات باستخدام (el‏ أداة من الأدوات البرمجيات 
المتاحة. ونأمل أن o$‏ هذا التعرض والتجريب تحفيز القراء على استكشاف قدرات هذه 
التقنيات US‏ في مجاله. ولتسهيل Jio‏ هذا الاستكشاف؛ فإننا سنورد في هذا الكتاب التدريبات 
التي توجّه القارئ إلى شبكة جامعة تيراداتا وغيرها من المواقع, والتي تشمل تدريباتٍ قائةٌ على 
العمل الجماعي إذا لزم الأمر. 
uy‏ هذا الفصل التمهيدي dade‏ للتحليلات بالإضافة إلى نظرة عامة على هذا LSI‏ 

ويحتوي على الأجزاء التالية: ١‏ 

1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة plei‏ وفهم تطبيقات التحليلات. 

Y-Y‏ بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار والتحليلات. 

Y-Y‏ تطؤر دعم القرار المحوسب لعلم البيانات/ التحليلات. 

٤-١‏ إطار عمل ذكاء الأعمال. 

0-١‏ نظرة عامة على التحليلات. 

7-١‏ أمثلة على التحليلات في مجالات مختارة. 

۷-١‏ مقدمة موجزة لتحليلات البيانات الضخمة. 

۸-١‏ نظرة dale‏ على النظام البيئي للتحليلات. 

9-١‏ خطة الكتاب. 

olge ٠١-١‏ وروابط والاتصال بشبكة جامعة تيراداتا. 
1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة لتعلّم وفهم تطبيقات التحليلات: 

ol‏ تطبيق التحليلات على مشكلات الأعمال من بين المهارات الأساسية التي ستتعلمها في هذا 

الكتاب» ويجري الآن fad‏ العديد من هذه الأساليب لتحسين عملية صُنع القرار في جميع جوانب 
الرياضةء وهو dire‏ مهم جدًا يُسمّى التحليلات الرياضية. isis‏ تحليلات الرياضة مثابة فن وعلم 
جمع بيانات عن الرياضيين والفرق؟ لتكوين رؤى من شأنها guas‏ القرارات الرياضية» مثل: تحديد 
اللاعبين الذين سيتمٌ الاستعانة بهم والأجور التي سيتمٌ دفعها لهم وكيف سيلعبون وكيف Gi‏ 
تدريبهم. وكيفية الحفاظ على «exo‏ ومتى هكن بيعهم ومتى يعتزلون. وبالنسبة للفرق؛ OB‏ 
ذلك ينطوي على قرارات الأعمال» مثل تسعير التذاكرء فضلاً عن القرارات المتعلقة بقائمة اللاعبين 
وتحليل نقاط قوة وضعف «allis S‏ والعديد من القرارات اليومية المتعلقة باللعبة. 


Y.‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dale‏ على 55« الأعمال والتحليلات وعلم البيانات 


في الواقع ÓI‏ التحليلات في مجال الرياضة لها طابعٌ خاص؛ نظراً لأهمية هذا المجال في كونه مجال 
أعمال كبيراً يعحقق إيرادات تبلغ ٠٤١‏ مليار دولار أمريكي تقريباً بشكلٍ سنوي؛ بالإضافة إلى ٠٠١‏ مليار 
دولار أخرى في الرهانات القانونية و١٠"‏ مليار دولار في الرهانات غير القانونية. في عام ١٠١۲م‏ وفقاً 
لمنظمة 4 Price Waterhouse‏ —& إنفاق Wo‏ مليون دولار فقط على التحليلات (أقل من 1٠,١‏ من 
الإيرادات)» ومن المتوقع أن ينمو الإنفاق معدل جيد Jas‏ إلى EV‏ مليار دولار بحلول عام Dev YA‏ 

حظي استخدامٌ التحليلات في مجال الرياضة بشعبية من خلال كتاب Moneyball‏ الذي كتبه 
Lewis Michael‏ في عام eY- -Y‏ وكذلك فيلم بطولة Brad Pitt‏ في عام ١١١٠م‏ والذي عرّض فيه 
Billy Beane‏ المدير العام لأوكلاند أ استخدام البيانات والتحليلات؛ لتحويل فريق خاسر إلى فريق 
فائز. على وجه الخصوص؛ el‏ بيني بن بتعيين محلل استخدم التحليلات لصياغة لاعبين قادرين 
على الحصول على قاعدة بدلاً من اللاعبين الذين تميزوا في التدابير التقليدية مثل عمليات الضرب 
أو القواعد المسروقة. هذه الأفكار مكّنتهم من صياغة توقعات تغفل عنها الفرق الأخرى برواتب 
مبدئية معقولة؛ لقد نجحت تلك الأفكار ووصلوا إلى التصفيات في عامي ۲۰۰۲ و١‏ ٠لام.‏ 

والآن يتم استخدامٌ التحليلات في جميع مناحي الرياضة. ويمكن تقسيمُ التحليلات ما بين 
المكتب الأمامي والمكتب الخلفيء ويُظهر مقال استبيان Tom Davenport‏ وصفاً جيداً لثلاثين 
Sa‏ وتشمل تحليلاث أعمال المكتب الأمامي تحليل سلوك الجماهير بدءً! من النماذج التنبؤية 
لتجديد تذاكر الموسم ومبيعات التذاكر العاديةء إلى توقعات التهديف من قبل المشجعين فيما 
يتعنّق بالفريق والرياضيين والمدربين, Sls‏ وهذا يشبه إلى 35 كبر إدارة علاقات العملاء 
التقليدية Åg (CRM)‏ التحليلٌ المالي WIS‏ من المجالات الرئيسة؛ حيث يُعد ol‏ الأقصى 
للراتب أو حدود البعثة جزءً! من المعادلة. 

adus‏ استخدام ا مكاتب الخلفية تحليلٌ JS‏ من الرياضيين الأفرادء وكذلك لعب الفريق. وبالنسبة 
للاعبين الفرديين؛ يتمثل التركيز على نماذج التوظيف وتحليلات الكشافة وتحليلات القوة واللياقة البدنية 


(1) Source: Changing the Game: Outlook for the Global Sports Market to 2015, Price Waterhouse 
Coopers Report, appears at https://www.pwc.com/gx/en/hospitality-leisure/pdf/changing-the game- 
outlook-for-the-global-sports-marketto-2015.pdf. Betting data from https://www.capcredit.com/ 
how-much-americansspend-on-sports-each-year/. 

(2) Sports Analytics Market Worth $4.7B by 2021,” Wintergreen Research Press Release, covered by PR 
Newswire at http://www.prnewswire.com/news-releases/sports-analytics-market-worth-47-billion- 
by-2021-509869871.html, June 25, 2015. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ف 


الفصل الأول 


وكذلك التنميةء ومتابعة الأداء cala) PMs‏ الإفراط في التدريب والإصابات» وكذلك فإن ارتجاج المخ 
من المجالات المهمة في الرياضة. وتش مل تحليلات الفريق الإستراتيجيات والتكتيكات» والتقييمات 
التنافسيةء والخيارات db‏ للقائمة في إطارٍ مختلف من الحالات الميدانية أو في الملاعب. وتوضّح 
الأمثلةٌ التوضيحية التالية كيف تستخدم ثلاث منظمات رياضية البيانات والتحليلات لتحسين العمليات 
الرياضيةء بنفس الطريقة التي قامت بها التحليلات بتحسين صناعة القرارات التقليدية في الصناعة. 


مثال١-‏ مكتب الأعمال: 


يعمل ديف وارد محلل أعمال لفريق كبير بلعبة البيسبول للمحترفين» ویرگز dlas‏ على العوائد 
وتحليل مبيعات ie‏ سواءً تذاكر موسم كامل أو تذكرة واحدة. بعض الأسثلة التي تخضع 
لمسؤوليته تتضمّن اذا oáz‏ (أو Y‏ يُجِدَّد) حاملو التذاكر الموسمية تذاكرهم» وكذلك العوامل التي 
تدفع الجمهور لشراء تذكرة مقعد فردي في آخر لحظةء وأيضاً كيفية تس عير التذاكر. وتشمل بعض 
الأساليب التحليلية التي يستخدمها مكتب Dave‏ إحصاءات بسيطة عن سلوك الجماهير. مثل الحضور 
العام والإجابات عن أسئلة الاستبيان حول احتمال الشراء Eya‏ أخرى. ومع ذلك؛ فقد يختلف ما يقوله 
الجماهير e‏ يفعلونه. ويقوم Dave‏ بإجراء استبيان المشجعين من خلال المكان المحجوز لمقعد 
التذكرة «الدرجة» ويسأل عن احتمال تجديد تذاكر الموسم. ولكنه عندما يقارن ما يقولونه مقابل ما 
يفعلونه؛ يكتشف اختلافات كبيرة (انظر الشكل .)١-١‏ حيث تبيّن له أن XI‏ من المشجعين في مقاعد 
ا الأول الذين قالوا في الاستبيان أنهم «قد «godog Y‏ قد جدّدوا بالفعل وكوّن هذا بالنسبة 
له ;5 جيدةً مفادها أنَّ العملاء في الخلايا الخضراء سيقومون على الأرجح بتجديد تذاكرهم؛ لذلك 
يحتاجون إلى جهد أقل في التسويق وصرف الدولارات dis‏ بالعملاء في الخلايا الزرقاء. 











مؤكد لا مجتمل لا ريما محتمل محتمل جدا الطبقة 
E i 45‏ 1 | 58 52 1 
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شكل :1-١‏ تجديد تذاكر الموسم - نتائج الدراسة الاستقصائية 


(3) Sources: Thomas Davenport, “Analytics in Sports: The New Science of Winning, International 
Institute for Analytics White paper, sponsored by SAS, February 2014. On the SAS Web site at: 
http://www.sas.com/content/dam/SAS/en us/doc/whitepaper2/iia-analytics-in-sports-106993.pdf. 
(Accessed July 2016). 


Yr‏ ذكاء الأعمال والتحليلات وعلم LLII‏ منظور إداري 


نظرة dale‏ على 55« الأعمال والتحليلات وعلم البيانات 


ولكن هناك Bas.‏ عوامل تؤثرٌ على سلوك الجمهور فيما يتعلق بشراء التذاكر وخاصةً السعر؛ 
مما يستدعي إجراء إحصاءات أكثر تطوراً وتحليل بيانات. في كلا المجالين وخصوصاً تذاكر اللعبة 
الواحدة؛ يقود ديف استخدام التسعير الديناميي؛ لينقل المجال من التسعير الثابت البسيط 
المعتمد على موقع المقعد إلى التسعير الديناميكي اليومي المتأثر بالصعود والهبوط. us‏ هذا 
المجال Siaa‏ بحثيًا ثريا للعديد من الفرق الرياضية من شأنه obj‏ فرص تحسين إيراداتهم. على 
سبيل اطثال: عند التسعير يجبٌ مراعاة سجل الفريق ومن يلعبون وتواريخ وتوقيت المباريات 
التي يلعب فيها اللاعبون النجوم لكلّ فريق» وتاريخ تجديد تذاكر الموسم أو شراء تذاكر فردية. 
بالإضافة إلى عوامل أخرى مثل مكان ا مقعد. وعدد المقاعد. والمعلومات التي تواكب وقت المباراة 
Jio‏ الازدحام المروري وقت المباراة وحتى الطقس. انظر الشكل ١-ا.‏ 








( كا الفزيق شخب الاش فى تخر :10 مزهريات 














شكل :۲-١‏ التسعير الحري للعمل السابق - دوري البيسبول الأساسي 

ii‏ من هذه العوامل أكثر أهميةً؟ وما مقدار أهميته؟ اعتماداً على الخبرة الإحصائية الواسعة؛ 
قام ديف ببناء نماذج انحدار لاستخلاص العوامل الرئيسية التي $935 تلك السلوكيات التاريخية 
e‏ بإنشاء PMs‏ لتحديد كيفية إنفاق موارد التسويق لدفع الإيرادات. كما قام بإنشاء نماذج 
مُخصّصة لحملة التذاكر الموسمية لتحديد شرائح العملاء الذين سيقومون أو لن يقوموا بالتجديده 
أو مَنْ لا يستطيعون اتخاذ قرار مناسب ومن خلال ذلك هكن BLUT‏ بحملات تسويقية أكثر 
دقة. وبالإضافة إلى ذلك؛ يقوم بإجراء إحصاء للتوقعات المتعلقة بالتهديف من خلال تعليقات 
الجمهور, مثل التغريدات التي تساعده على تقسيم المشجعين إلى شرائح ولائية مختلفة. وتساعد 
الدراسات الأخرى عن دوافع حضور لعبة فردية إدارة التسويق على فهم تأثير الهدايا مثل القمصان 
Asok‏ أو اقتراحات حول أماكن نشر الإعلانات التلفزيونية الفورية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري "t‏ 


الفصل الأول 


وبالإضافة إلى الإيرادات؛ يوجد العديدٌ من المجالات التحليلية الأخرى التي يعمل عليها فريق 
Dave‏ مما في ذلك التسويقء وعوائد إعلانات الراديو والتليفزيون وتقديم البيانات إلى المدير 
العام glis‏ المفاوضات على الراتب» ومشاريع التحليلات الخاصة بالنظر إلى الحَدَّ الأقصى للراتب» 
وفعالية الترويج Ue‏ في ذلك القنوات الإعلانية» والتوعية بالعلامة التجاريةء وكذلك تحليلات الشركاء. 


























نسبة الجري :46,4816 
انسبة التمرير: 53,5296 
إذا كانت نسبة الخطا 
.22 ,11,20 ,10 
f‏ 32 ,31 ,30 ,12,21 
إجمالى 385148 La‏ اللعبات:155 
نسبة الجري:33.2596 السبة 793594 
نسبة للتمرير: 66.15% انسبة للتمرير: 206596 
لحا الأول أو anim‏ 












إجمالى اللعبات:294 
نسبة الجري:38.78% 
نسبة التمرير: 6122296 






نحن تقود او 
الأمر تعادل 















إجمالى اللعبات,66 إجمالى :132 إجمالى اللمبات:162 
نسبة الجري:4.55% نسبة الجري :24.2496 انسبة الجري:50.629 
ipai‏ التمرير؛ 75.6796 نسبة التمرير: 49.38% 


نسبة للتمرير: 95.4594 





شكل :۳-١‏ شجرة القرارات المتتالية لتنفيذ أو تمرير اللعبات 


:The Coach المدرب‎ -Y JU 
بشكلٍ كاملٍ على الفوز‎ Sd بوب بريدلوف مدربٌ كرة قدم لفريق إحدى الكليات الكبيرة»‎ 
بوب على استقطاب أفضل اللاعبين في المدارس الثانوية» وتطوير مهاراتهم‎ Sy بالمباريات.‎ 
ممكن منهم في أثناء‎ Jar وكذلك الحصولٌ على أقصى‎ slag dogam لتتناسب مع أنظمة‎ 
المباريات. يقع تحت مسؤولياته أيضاً الإجابة عن أسئلة مثل: مَنْ سنستقطبٌُ من اللاعبين؟ ما‎ 
blä التدريبات التي تساعدٌ على تطوير مهاراتهم؟ ما مدى صعوبة دفع وتحفيز لاعبينا؟ وما‎ 

قوة وضعف المنافسين؟ وكيف LSe‏ معرفة أو التعرّف على اتجاه لعبهم؟ 

gaddo‏ الحظ؛ استعان فريقه بخبيرة عمليات الفريق الجديدة دار برناك المتخصّصة في 
مساعدة المدربين في اتخاذ القرارات التكتيكيةء وتعمل دار مع فريق من الطلاب المتدربين الذين 
يقومون بإجراء تحليلات للخصم باستخدام فيلم bL‏ والذي يقوم المدربٌ بالتعليق عليه لإنشاء 
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نموذج شجرة القرارات المتتالية كما في الشكل Y-Y‏ للتنبؤ Le‏ إذا كانت المباراة التالية ستكون مباراة 
جري أو تمرير. أمّا بالنسبة للمنسق الدفاعي؛ فقد قاموا ببناء خرائط حرارية كما في الشكل 6-١‏ 
JS)‏ هجوم للخصم لتوضيح ali‏ إلى التمرير إلى اليسار أو اليمين وإلى مناطق التغطية الدفاعية. 
daas‏ قاموا بإجراء تحليلات لبعض السلاسل الزمانية كما في الشكل 0-١‏ على المباريات القوية 
(تُعرف على أنها الحصول على VI‏ تمريرة صحيحة أو الجري لمسافة ١7‏ ياردة أو أكثر). لكل مباراة 
يقارنون نتائج التحليل بتشكيلاتهم الدفاعية وهجوم الفرق المنافسة لمساعدة المدرب بريدلوف 
على التفاعل بسرعة أكبر مع التحؤلات في أثناء BL‏ سيتم شرح هذه الأساليب التحليلية بشكل 
مفصل في الفصول الثاني والخامس والسابع. 









c 
22:5 
اجمالي:27‎ 
81.48% 

ساحن : 

































شكل 6-1: تحليل منطقة الخريطة الحرارية للتمريرات 
وتش مَل الأعمال الجديدة التي تقو تقوم Dar Lg;‏ بناء e‏ أفضل لاستقطاب الرياضيين من 
المدارس الثانوية. فعلى سبيل المثال؛ يقدِّم فريق العمل في JS‏ عام منحاً ala‏ & لثلاثة طلاب 
يتم اختيارهم للفريق. أما بالنسبة ل Dar‏ فإن اختيار أفضل اللاعبين لا يقتصر على المقاييس 
البسيطة Jia‏ مدى سرعة اللاعبين» ومدى ارتفاع قفزاتهم» وطول أذرعهم؛ بل يتخطاها إلى معايير 
جديدةء Jia‏ مدى سرعة تدوير رؤوسهم لالتقاط التمريرات» وما أنواع وأوقات رد الفعل للاعب 
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الفصل الأول 


على المؤثرات المتعددة. ومدى دقة تنفيذه للتمريرات. iig‏ بعض أفكار دار في توضيح هذه 
المفاهيم على موقع TUN‏ على شبكة الإنترنت؛ ابحث عن BSI Case of Precision Football‏ . 

















شكل :0-١‏ تحليل السلاسل الزمنية للعبات الساخنة 
مثال*- المدرب :The Trainer‏ 


يعمل الدكتور دان جونس ون مدرباً لفريق كرة القدم بكلية المرأة لمساعدة اللاعبات على 
الحفاظ على صحتهن وتقديم المشورة للمدربين بخصوص قدرة التحمّل لكل لاعبة خلال 
التدريبات. كذلك يهتمٌ جونس ون برفاهية اللاعبات ما في ذلك مقدار النوم ووقت الراحة لكل 
لاعبة بين فترات التدريب الثقيلة والخفيفة, والهدف من ذلك KTI‏ من استعداد اللاعبات للعب 
بأقصى قدرٍ ممكن من الكفاءة في آثناء المباريات. 

ولخُسْن eod‏ وبسبب اس تخدام الأجهزة الرياضية المتطوّرة؛ كان هناك ال مزيدٌ من البيانات 
التي coxa‏ الدكتور Dan‏ من التحليل. فقد كانت اللاعبات يستخدمن GIAA‏ تحتوي على أجهزة 
الاستشعار يمكن من خلالها قياس الأحمال الداخلية؛ مثل ضربات القلب» ودرجة حرارة الجسم 
ومُعدلات التنفس علاوةً على clus‏ التسارع التي تقيسٌ الأحمال الخارجيةء مثل العدو لمسافات 
والسرعات وكذلك التسارع والتباطؤ. ومن ثم التعرّف على اللاعبات اللاتي يُعطين أقصى جهد 
خلال التدريبات ومن لَسْنَ كذلك. 





n‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dale‏ على 55« الأعمال والتحليلات وعلم البيانات 


وينصبٌ تركير جونس ون Glo‏ على الأبحاث التي تساعده في التنبؤ بإصابات اللاعبات وكيفية 
الوقاية منها (الشكل .)1-١‏ ويمكن أن ÉS‏ تدريبات بسيطة مثل الوقوف على ساق واحدة 
وجلوس القرفصاء واختبار إمساك ساق ثم السّاق الأخرى مع وجود فرق نقاط أكثر من >٠١‏ رؤى 
مفيدة لجونسون حول US‏ قوة وضعف الجسم كما في شكل N-Y‏ فإذا أصيبَت لاعبة خلال 
المباراةء هكن للمدرب إجراءٌ اختبار جانبي لرد فعل تحفيزي على جهاز محمولء والتي تضيفٌ إلى 
بروتوكولات الصدمات التقليدية. وتظهر أجهزة استشعار النوم مَنْ الذي يحتاج إلى الحصول على 
راحة كافية (أو الذين سهروا طوال الليل). كما استعان د. دان بمختبر التصوير بالرنين المغناطيسي 
في الحرم الجامعي للقيام مسح الدماغ الدوري لإظهار أي الرياضيين عُرضةً للإصابة بإصابات الدماغ. 


























شكل :۷-١‏ اختبار قرفصاء الساق الواحدة 
شكل :5-١‏ نماذج إصابات كرة Oas)‏ - اختبار قوة الجسم الأساسية 





)0( "إصابات كرة القدم للسيدات" المركز القومي لتقارير بحوث الإصابات الرياضية الكارثية. NCAA‏ يتم إنتاج أوراق واقع 
الإصابات الرياضية NCAA‏ بواسطة مركز Datalys‏ لأبحاث الإصابات الرياضية والوقاية منها بالتعاون مع الرابطة القومية 
لرياضة الجامعات وإصابات رياضة STOP‏ تصدر فيه 

https://www.ncaa.org/sites/default/files/NCAA W Soccer Injuries WEB.pdf 
(YNT (تم الوصول إليها في نوفمير‎ 
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أسئلة على هذه الأمثلة: 

-١‏ ما العوامل الثلاثة التي قد تكون جزءً! من PM‏ لتجديد تذكرة الموسم؟ 

-Y‏ ما الأساليب التي هكن أن تستخدمها فرق كرة القدم للقيام بتحليل الخصم؟ 

*- كيف يكن للأجهزة القابلة للارتداء تحسين صحة وسلامة اللاعب؟ وما أنواع التحليلات 
الجديدة التي يمكن أن يستخدمها المدربون؟ 

-E‏ ما استخدامات التحليلات الأخرى التي يمكنك تصورها في الألعاب الرياضية؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة القصيرة: 

بعيدًا عن ull‏ الأعمال في المكاتب الأمامية وا مدربين وخبراء الأداء؛ فإن هناك العديد من 
الأشخاص الآخرين في الألعاب الرياضية يستخدمون OBLI‏ بدءًا من لاعبي الجولف الذين 
يقيسون ظروف التربة والأرض لبطولات PGA‏ وحكام البيسبول وكرة السلة الذين يتم تقييمهم 
sta‏ على قراراتهم الصحيحة وغير الصحيحة التي يجرونها. وني الواقع؛ يصعب العثور على مجال 
من مجالات الرياضة لا Slo‏ بتوفر المزيد من البيانات» وخاصةً من أجهزة الاستشعار. 

ól‏ المهارات التي ستتعلمها في هذا الكتاب لتحليل الأعمال تنطبق على الرياضة. فإذا كنت 
ترغب في التعمق في هذا المجال؛ فإننا نشجعك على الاطلاع على قسم تحليلات الرياضة بشبكة 
جامعة تيراداتا (TUN)‏ وهي مصدرٌ مجاني للطلاب وأعضاء هيئة التدريس. وفي هذا الموقع؛ 
سوف تجد وصفاً U‏ يجب قراءته لمعرفة المزيد عن التحليلات الرياضيةء ومجموعات من الأماكن 
التي يمكنك العثور بها على مجموعات البيانات المتاحة للجمهور للتحليل؛ فضلًا عن أمثلة gU‏ 
الطلاب في تحليلات الرياضة ومقابلات المهنيين الرياضيين الذين يستخدمون البيانات والتحليلات 
للقيام بوظائفهم. 
7-١‏ بيئات الأعمال المتغيرة والاحتياجات المتطوّرة لدعم القرار والتحليلات: 

توضّح المقالة الافتتاحية كيف هكن للصناعة بأكملها أن تستخدم تحليلات لوضع تقارير Ge‏ 
يحدث» والتنبؤ ا هكن أن يحدثء ومن ثم اتخاذ القرارات أيضاً لتحقيق أفضل استفادة من 
Sources: Business Scenario Investigation BSI: The Case of Precision Football (video). (Fall 2015).‏ )4( 


Appears on http://www.teradatauniversitynetwork.com/About-Us/Whats-New/BSI-Sports-Analytics- 
Precision-Football//, Fall 2015. (Accessed September 2016). 
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الوضع القائم. وتتطلّب هذه الخطوات من المنظمة جمع وتحليل المخزون الضخم من البيانات. 
ومن الاستخدامات التقليدية في وظائف كشوف المرتبات وإمساك الدفاترء توغلت النظم المحوسبة 
الآن في مجالات إدارية معقدة تتراوح بين تصميم وإدارة المصانع الآلية إلى تطبيق أساليب تحليلية 
لتقييم عمليات الاندماج والاستحواذ المقترحة. ويعرف جميع المديرين التنفيذيين تقريبًا أن تقنية 
المعلومات ذات أهمية حيوية لأعمالهم ويستخدمون تقنيات المعلومات على نطاق واسع. 
وقد انتقلت تطبيقات الحاسوب من أنشطة معالجة المعاملات ورصدها إلى تحليل المشكلات 
وتطبيقات الحلولء وتم ELEI‏ بالكثير من الأنشطة باستخدام التقنيات المستندة إلى السحابة. التي 
تم الوصول إليها في كثير من الحالات من خلال الأجهزة المتنقلة. إن أدوات التحليل وذكاء الأعمال 
dio‏ مستودع البيانات, والتنقيب في Obh‏ والمعالجة التحليلية الفورية (OLAP)‏ ولوحات 
ا معلومات» واستخدام الأنظمة القائمة على السحابة لدعم القرار؛ هي أهمٌ عناصر الإدارة الحديثة 
في الوقت الحاضر. وأصبح من المحتمل أن يكون لدى المديرين أنظمة معلومات وشبكات (سلكية 
أو لاسلكية) عالية السرعة لمساعدتهم في مهمتهم الأكثر أهميةٌ وهي اتخاذ القرارات. às.‏ كثيرٍ من 
الحالات» يتح تنفيذ مثل هذه القرارات آلياً بشكل روتيني؛ مما يلغي الحاجة إلى (Sl‏ تدخل إداري. 
وبالإضافة إلى الزيادة الواضحة في قدرات المكوّنات المادية والبرمجيات والشبكات؛ ساهمت 
بعض التطورات بشكل واضح في تسهيل زيادة دعم القرارات والتحاليل بعدة «3o‏ منها: 
- التواصل والتعاون الجماعي: يتم اتخاذ العديد من القرارات اليوم من قبل المجموعات التي قد 
يكون أعضاؤها في مواقع مختلفة. وتستطيع ا مجموعات التعاون والتواصل بسهولة باستخدام 
أدوات التعاون وكذلك الهواتف الذكية في S‏ مكان. ويكتسب التعاون ical‏ خاصة على 
امتداد سلاسل التوريد؛ إذ يجب على الشركاء تبادل المعلومات مع المورّدين والعمال بصفة 
مستمرة. وقد يكون تجميع مجموعة من صانعي القرارء وخاصةً الخبراءء في مكانٍ واحد 
باهظ التكلفة. وبالتالي يمكن لنظم المعلومات أن تحسّن عملية التعاون في مجموعة ما وتمكن 
أعضاءها من التواجد في مواقع مختلفة (لتوفير تكاليف السفر). والأهم من ذلك؛ أن هذا 
التعاون في سلاسل التوريد يسمح للمصتعين بمعرفة أنماط التغير في الطلب في الوقت المناسب» 
وبالتالي يتفاعلون مع OUS‏ السوق بشكل أسرع. 
)0( «إصابات كرة القدم للسيدات» المركز القومي لتقارير بحوث الإصابات الرياضية الكارثية. NCAA‏ يتم إنتاج أوراق واقع الإصابات 
الرياضية NCAA‏ بواسطة مركز Datalys‏ لأبحاث الإصابات الرياضية والوقاية منها بالتعاون مع الرابطة القومية لرياضة الجامعات 
وإصابات رياضة STOP‏ تصدر https//www.ncaa.org/sites/default/fles/NCAA "W Soccer Injuries WEB.pdf. à‏ 
(تم الوصول إليها في نوفمير AYAN‏ 
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- تحسين إدارة البيانات: تنطوي العديدٌ من القرارات على حسابات مُعقدة تعتمد على Olly‏ 
مخزنة في مستودعات مختلفة في أماكن داخل وربما خارج المنظمة. وقد تتضمّن البيانات النص 
والصوت والرسومات والفيديوء وقد تكون هذه الصيغ بلغات مختلفة. وفي S‏ من الأحيان 
يكون من الضروري نقل البيانات بسرعة من مواقع بعيدة. ومن خلال أنظمة اليوم يمكن 
البحث عن البيانات اللازمة وتخزينها ونقلها بسرعة وبتكلفة اقتصادية وأمان وشفافية. 

- إدارة مستودعات البيانات العملاقة والبيانات الضخمة: تحتوي مستودعات البيانات الضخمة 
مثل تلك التي تديرها Walmart‏ على كميات هائلة من البيانات. وتتوفر أساليب خاصة: بما في 
ذلك الحوسبة المتوازية» Hadoop/Sparks‏ ومثيلاتها لتنظيم البيانات والبحث فيها والتخلص 
منها. وتتناقص تكاليف تخزين والتنقيب في البيانات de a‏ هذه التقنيات تندرجٌ تحت فئة 
واسعة من البيانات الضخمة التي تمّ جمعها من مصادر متنوعة وبأشكال مختلفةء جمع تلك 
البيانات يعطي رؤية كاملة للأداء التنظيمي هذه الرؤية لم تكن ممكنةً في الماضي. 

- الدعم التحلياي: ومع المزيد من تقنيات البيانات والتحليل» هكن تقييمٌ المزيد من البدائل» 
ويمكن تحسين التنبؤات» ويمكن إجراء تحليل المخاطر بسرعة» كما يمكن جمع آراء الخبراء 
(وبعضهم في مواقع نائية) بسرعة وبتكلفة منخفضة. ويمكن استخلاص الخبرة حتى بشكلٍ 
مباشر من النظم التحليلية. وباستخدام هذه الأدوات» يستطيع صانعو القرار إجراء محاكاة 
معقدة والتحقق من العديد من السيناريوهات المحتملة» وتقييم الآثار المتنوعة بسرعة 
واقتصادية. وهذا بالطبع هو محور عدة فصول في هذا الكتاب. 

co dili -‏ على الحدود ا معرفية في معالجة وتخزين المعلومات: وفقاً ل (1977) Simon‏ إذ ŠL‏ 
للعقل البشري 3 $54 oguna‏ على معالجة وتخزين المعلومات. ويجد الناس أحياناً صعوبة في 
استرجاع واستخدام المعلومات دون أخطاء بسبب حدودهم المعرفية. ويشير مصطلحٌ الحدود 
المعرفية إلى أن قدرة الفرد على حل المشكلات تكون محدودةً عندما تكون هناك حاجة إلى 
مجموعة واسعة من المعلومات والمعرفة المتنوعة. فالنظم المحوس بة تمن الناس من coil‏ 
على حدودهم الإدراكية من خلال الوصول السريع ومعالجة كميات هائلة من ا معلومات المخزنة. 

- إدارة المعرفة: وقد جمعت المنظمات مستودعاتٍ هائلة من المعلومات عن عملياتها الخاصة, والعملاء 
والإجراءات الداخلية. وتفاعلات الموظفينء وما شابه ذلك. من خلال الاتصالات المهيكلة وغير المهيكلة 
التي تجري بين مختلف أصحاب المصالح. وأصبحت نظم إدارة المعرفة بالنسبة للمديرين مصادر 
للدعم الرسمي وغير الرسمي لاتخاذ القرارات» وإن كانت لا تسمى أحياناً بنظم إدارة المعرفة. التقنيات 
مثل تحليل النصوص IBM Watsons‏ جعلت من الممكن استخراج قيمة من هذه المستودعات. 
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هذا أكبر تغيير حدث في السنوات القليلة الماضية. فالسرعة التي تحتاج إلى معالجة ا معلومات 
وتحويلها إلى قرارات قد غيرت بالفعل توقعات المستهلكين والشركات على io‏ سواء. وقد Sl‏ 
ds‏ ذلك إلى استخدام الدعم ا محوسب للقرارات منذ أواخر الستينيات» وبصفة خاصة منذ 
منتصف التسعينيات. وقد أتاح نمو التقنيات المتنقلة ومنصات وسائل التواصل الاجتماعي 
والأدوات التحليلية مستوّى مختلفاً من دعم نظم المعلومات (IS)‏ للمديرين. ولا هتد هذا النمو 
في توفير الدعم المعتمد على البيانات لأي قرارٍ إلى المديرين فحسب ولكن أيضاً إلى المستهلكين. 
وسنقوم أولاً بدراسة لمحة dale‏ عن التقنيات التي تمت الإشارة إليها على نطاق واسع باسم ذكاء 
الأعمال. من هذا المنطلق سوف نقوم بتوسيع آفاقنا لتقديم أنواع مختلفة من التحليلات. 


أسئلة مراجعة على القسم :7-١‏ 

-١‏ اذكر بعض الاتجاهات الرئيسة الموجهة بالنظام والتي cie‏ عملية صُنع القرار التي تدعمها 
نظم المعلومات "IS"‏ إلى مستوى جديد؟ 

-Y‏ اذكر بعض قدرات نظم المعلومات التي يمكن أن Jas‏ اتخاذ القرارات الإدارية. 

-Y‏ كيف هكن للحاسوب المساعدة في التغلّب على الحدود الإدراكية للإنسان؟ 


Sla Y-Y‏ دعم القرار المحوسب لعلم البيانات/ التحليلات: 

did‏ الجدول tuia‏ الوارد في الشكل (A-1)‏ المصطلحات المستخدمة لوصف التحليلات منذ 
السبعينيات. وخلال السبعينيات؛ كان ZSA‏ الأساسي لنظم المعلومات في دعم القرارات على 
تقديم تقارير دورية منظمة هكن للمدير استخدامُها في اتخاذ القرارات (أو تجاهلها). وقد بدأت 
الأعمال في إنشاء تقارير روتينية لإبلاغ صانعي القرار (المديرين) ما حدث خلال فترة سابقة (يوم» 


المصدر والاعتمادات: لقد pB‏ الدكتور Dave Schrader‏ بتلك المساهمة, والذي تقاعد بعد YE‏ عاماً من التطوير 
والتسويق المتقدمين في lob‏ وقد JB‏ في مجلس المستشارين بشبكة جامعة تيراداتا؛ ليقضي فترة تقاعده في مساعدة 
الطلاب وأعضاء هيئة التدريس على معرفة المزيد عن التحليلات الرياضية. تم تصميم صور كرة القدم (الأشكال Y-V‏ 
و١-0)‏ بواسطة طلاب الدراسات العليا Jacob Pearson s Peter Liang‏ بجامعة أوكلاهوما الحكوميةء كجزء من مشروع 
طلابي في ربيع عام SY Y‏ وتم اقتباسٌ صور التدريب (الأشكال 7-١‏ و١-۷)‏ من الصور التي قدّمها JS‏ من البروفيسور 
Gary Wilkerson‏ من جامعة تينيسي في تشاتانوجا والبروفيسور Ashish Gupta‏ من جامعة أوبورن. 
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أو أسبوع أو à‏ شهرء أو ربع سنة). ues‏ الرغم من أنه كان من المفيد معرفة ما حدث في الماضي: 
LS‏ المديرين كانوا بحاجة إلى أكثر من ذلك؛ لأنهم يحتاجون إلى مجموعة متنوعة من التقارير 
على مستويات مختلفة من التفصيل لفهم ومعالجة الاحتياجات والتحَدَّيات المتغيرة للشركة 
بشكل أفضل. ales‏ ما Gi aS‏ هذه ehi‏ ا معلومات الإدارية (MIS)‏ في أوائل السبعينيات» 
وقد طرح Scott-Morton‏ المفاهيم الرئيسة لنظام دعم القرار DSS‏ وقد غرفت نظم دعم 
القرار 12555 بأنها «أنظمة حاسوبية تفاعليةء تساعد صُناع القرار على استخدام البيانات والنماذج 
ded‏ المشكلات غير المهيكلة» .Scott-Morton (1971)  Gorry‏ وفيما يلي تعريف كلاسيكي 
آخر ل DSS‏ والذي 4533 :Scott-Morton (1978) 5 Keen‏ 


تجمع نظم دعم القرار بين الموارد الفكرية للأفراد مع قدرات الحاسب ب؟ لتحسين 
نوعية القرارات. وهو نظام دعم قائم على الحاسوب لصناع القرار الإداريين الذين 
يتعاملون مع المشكلات شبه الهيكلية. 











شكل :۸-١‏ تطور دعم القرار وذكاء الأعمال والتحليلات 

لاحظ ol‏ مصطلح «نظام دعم القرار»» مثل نظام المعلومات الإدارية والعديد من المصطلحات 
الأخرى في مجال تقنية المعلومات. هو تعبيرٌ JU‏ من المحتوى ise)‏ أنه يعني أشياء مختلفة 
لأشخاص مختلفين). ولذلك؛ لا يُوجَد تعريف مقبول عاِيًا لنظام دعم القرار. 

وخلال الأيام الأولى من التحليلات؛ غالبًا ما يتم الحصول على البيانات من خبراء المجال 
باستخدام العمليات اليدوية (أيْ: المقابلات والاستقصاءات) لبناء النماذج الرياضية أو المعرفة 
القائمة على d‏ مشكلات التحسين المقيّدة. وكانت الفكرة هي تحقيق الأفضل بالموارد المحدودة. 
Gales‏ ما تُسمّى ges e‏ القرار هذه باسم بحوث العمليات (OR)‏ ولقد تمت معالجة 
المشكلات التي كانت معقدةً إلى درجة م يكن يمكن حلها على النحو الأمثل (باستخدام أساليب 


er‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dale‏ على ذكاء الأعمال والتحليلات وعلم البيانات 





البرمجة الرياضية الخطية أو غير الخطية) باستخدام أساليب الاستدلال مثل نماذج المحاكاة. 
(سنقدّم هذه التحاليل الوصفية لاحقاً في هذا الفصل وبتفاصيل أكثر في الفصل السادس). 

وقي أواخر السبعينيات وأوائل الثمانينيات؛ وبالإضافة إلى نماذج بحوث العمليات الناضجة 
التي كانت plai as‏ في العديد من الصناعات والنظم الحكومية؛ ظهرت مجموعةٌ جديدةٌ ومثيرة 
من النماذج مثل: نظم الخبراء القائمة على القواعد. وقد Copia‏ هذه الأنظمة بحصر معارف 
الخبراء في شكل تستطيع الحواسيب معالجته (من خلال مجموعة من القواعد أو الاستدلالات)؛ 
بحيث يمكنُ استخدام هذه القواعد للتشاور بنفس الطريقة التي يستخدمها خبراءٌ المجال لتحديد 
مشكلة مهيكلة ووصف Jodi‏ الأكثر احتمالًا. وقد سمحت النظم الخبيرة ESS‏ بتوفير الخبرة 
النادرة عندما يلزم الأمر؛ وذلك باستخدام نظام دعم القرار DSS‏ «الذي». 

ولقد coda‏ الثمانينيات تغيرًا كبيرًا في طريقة استحواذ المنظمات على البيانات المتعلقة 
بالأعمال التجارية. وكانت الممارسة القدهة تتمثل في وجود عدة نظم معلومات مُفكّكة مُصمّمة 
Lása‏ لتجميع بيانات المعاملات لمختلف الوحدات أو الوظائف التنظيمية (مثل: امحاسبة 
والتسويقء «ol sells‏ والتمويلء والتصنيع). وفي الثمانينيات؛ تمّ دمج هذه الأنظمة كنظم 
معلومات على مستوى المؤسسة التي نسميها الآن نظم تخطيط موارد المؤسسة (ERP)‏ وتم 
استبدالٌ مخططات تمثيل البيانات القدهة المتسلسلة وغير المعيارية بأنظمة إدارة قواعد البيانات 
العلائقية (RDBM)‏ وقد أتاحت هذه النظم تحسين الحصول على البيانات وتخزينهاء فضلًا عن 
العلاقات بين حقول البيانات التنظيمية مع انخفاض ملحوظ في تكرار المعلومات. 

وبرزت الحاجة إلى نظم إدارة قواعد البيانات العلائقية (RDBM)‏ ونظم تخطيط موارد المؤسسة 
(ERP)‏ عندما أصبحت سلامة البيانات واتساقها مشكلة؛ مما أعاق بشكل S‏ فعالية الممارسات 
التجارية. وبتخطيط موارد المؤسسات؛ يتخ US kap‏ البيانات من جميع أركان ا مؤسسة ودمجها 
في مخطط Cub‏ بحيث يكون dS‏ جزءٍ من المنظمة do‏ الوصول إلى نسخة واحدة من الحقيقة 
متى لزم الأمر. وبالإضافة إلى ظهور أنظمة تخطيط موارد المؤسسات» أو رها بسبب هذه الأنظمة؛ 
أصبح إعداد تقارير الأعمال ممارسة تجارية حسب الطلبء أو حسب الحاجة. وهمكن لصناع القرار 
أن يُقَرّروا متى يحتاجون أو يريدون إنشاء تقارير متخصصة لتقم المشكلات والفرص التنظيمية. 

ds‏ التسعينيات. أذّت الحاجة إلى إعداد تقارير أكتر تنوعًا إلى تطوير أنظمة المعلومات 
التنفيذية (تمّ تطويرٌ نظم ال معلومات التنفيذية 8155 ونظام دعم القرار خصيصًا للمديرين 
التنفيذيين واحتياجاتهم من اتخاذ القرار) وقد صُّمّمت هذه الأنظمة على شكل olog‏ بيانية 
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وبطاقات قياس؛ بحيث يكن أن تكون dite‏ عروض جذَّابة بصريًا مع التركيز على kal‏ العناصر 
التي يمكن لصانعي القرار من خلالها iss‏ مؤشرات الأداء الرئيسة. ولجعل هذا التقرير AS]‏ 
تنوعًا مع الحفاظ على سلامة المعاملات لنظم المعلومات التجارية؛ كان من الضروري إنشاء طبقة 
البيانات المتوسطة المعروفة باسم مستودعات البيانات (DW)‏ كمستودع لدعم تقارير الأعمال 
x uos‏ القرار تحديدًا. وخلال وقتِ قصير جدًا؛ اعتمدت معظم الشركات الكبيرة وا متوسطة 
الحجم مستودع البيانات كمنصة لصُنع القرار على مستوى المؤسسة. وحصلت لوحاث المعلومات 
وبطاقات الأداء على بياناتها من مستودعات البيانات (DW)‏ وبذلك cuf nos‏ كفاءة أنظمة 
المعاملات التجارية التي يُشار إليها في معظمها بأنظمة تخطيط موارد المؤسسة (ERP)‏ 

وف العقد الأول من القرن العشرين؛ بدأ يُطلّق على الأنظمة القائمة على مستودعات البيانات 
اسم «أنظمة ذكاء الأعمال». ومع ازدياد كمية البيانات الطولية المتراكمة في مستودعات البيانات؛ 
كان لا E‏ أن تواكب قدرات الأجهزة والبرمجيات الاحتياجات المتطورة والسريعة التغيّر لصانعي 
القرار. وبسبب السوق التنافسية المعويلة؛ يحتاج صانعو القرار إلى استيعاب المعلومات الحالية 
في قالب سهل الفهم لمعالجة مشكلات الأعمال والاستفادة من فرص السوق في الوقت المناسب. 
ds‏ حين يتم تحديث البيانات في مستودعات البيانات JS ia‏ دوري؛ فإنها لا تعكس أحدث 
العلومات. : وللتغلب de‏ هذة اله كلة اللتعلقة بوقث الوصول إلى Cl agat!‏ طور 359A‏ 
مستودعات البيانات نظامًا لتحديث البيانات بشكل SS]‏ تواترّ؛ مما أدّى إلى الاستيداع في الوقت 
المناسب للبيانات» والذي يختلف عن المنهج السابق في التخزين من خلال اعتماد سياسة تحديث 
البيانات على أساس التحديث المطلوب لعناصر البيانات iS)‏ ليس كل عناص البيانات تحتاج 
إلى تحديث بشكل فوري). إِنَّ مُستودعات البيانات ضخمةٌ جداً وهي ميزة هائلة. وأصبح من 
الضروري «استخراج» البيانات الخاصة بالشركة؛ من أجل «اكتشاف» ا معلومات الجديدة والمفيدة 
لتحسين عمليات وممارسات الأعمالء ومن ثم مُصطلحَيْ التنقيب في البيانات والتنقيب في النص. 

ومع تزايد حجم البيانات وأصنافها؛ ظهرت الحاجة إلى المزيد من التخزين وقوة المعالجة. 
وعلى الرغم من أنَّ الشركات الكبيرة لديها الوسائل اللازمة ملعالجة هذه المشكلة؛ jb‏ الشركات 
الصغيرة الحجم تحتاج إلى نماذج أعمال أكثر ALB‏ للإدارة المالية. وقد SS‏ هذه الحاجة إلى 
نماذج الخدمات الموجّهة نحو الخدمة والبرامج والبنية التحتية كخدمة تحليل الخدمات. وبالتالي؛ 
coe‏ الشركات الصغيرة من الوصول إلى إمكانيات التحليلات حسب الحاجة: وتدفع فقط مقابل 
ما استخدموه. بدلاً من الاستثمار JU‏ في موارد الأجهزة والبرامج الحاسوبية. 

diag‏ عام ١٠١۲م‏ وحتى GI‏ ونحن نشهد esi dio‏ أخرى في dis o‏ رَصْد البيانات واستخدامها. 
وبسبب انتشارٍ استخدام الإنترنت على نطاق واسع؛ ظهرت Silog‏ جديدة لتوليد البيانات مثل بطاقات 
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تعريف ترددات الراديو [REID]‏ وعدادات الطاقة الرقميةء وسجلات النقر عبر الإنترنت» والأجهزة 
المنزلية ASII‏ ومُعدَّات المراقبة الصحية القابلة للارتداء وربما كان أكثرها أهميةٌ الشبكات الاجتماعية 
والتي ool‏ إلى ظهور بيانات غير مهيكلة, هذه البيانات غنية بالمحتوى؛ ولكنها صعبة التحليل من 
ناحية البرمجيات والأجهزة على a‏ سواء. وف الآونة الأخيرة؛ ظهر مصطلح البيانات الضخمة JL]‏ 
الضوء على التَحَدَّيات التي جلبتها L‏ هذه البيانات الجديدة. وقد تمّ تطويرٌ العديد من التحسينات 
في JS‏ من الأجهزة (فعلى سبيل المثال: المعالجة المتوازية على نطاق واسع مع الذاكرة الحسابية الكبيرة 
lo‏ ونظم الحوسبة متعددة المعالجات المتوازية للغاية) والبرمجيات/ الخوارزميات» مثل Hadoop)‏ 
مع (NoSQLs MapReduce‏ والتي 5& تطويرها iial‏ على تحديات البيانات الضخمة. 

ومن الصعب التنبؤ بما سوف يحدث خلال العق د القادم في مجال التحليلات» وما المصطلحات 
الجديدة التي ستظهر؛ لقد all al‏ الفجوة بين نماذج أنظمة المعلومات والتحليلات» وسيستمر 
في المستقبل القريب رغم أنَّ التحليلات ليست جديدةٌ؛ ولكن شعبيتها تزايدت بشكلٍ ملحوظ مؤخرًا 
وبفضل التزايد الهائل في البيانات الضخمة؛ أصبحت طرق جمع وتخزين هذه البيانات» وأدوات 
البرمجيات البديهيةء والرؤى التي تعتمد على البيانات أكثر سهولة لرجال الأعمال من أي وق مضى. 
ce‏ وفي خضم المنافسة العامميةء أصبحت الفرصة كبيرةٌ لاتخاذ قرارات إدارية أفضل باستخدام البيانات 
والتحليلات لزيادة الإيرادات مع خفض التكاليف من خلال إخراج منتجات abad‏ وتحسين تجربة 
العملاءء واكتشاف الاحتيال قبل حدوثهء وتحسين تفاعل العملاء من خلال الاستهداف والإنتاج حسب 
طلب العميل مع قوة التحليلات والبيانات. ويتزايد Sas‏ الشركات التي تقوم Ule‏ بتدريب موظفيها 
على أدوات تحليل الأعمال؛ من أجل تحقيق أكثر فعالية وكفاءة في عمليات صنع القرارات اليومية. 

ويركز القسم التالي على إطار عمل ذكاء الأعمال. es‏ الرغم من أن معظم الناس يتفقون على أن 
ذكاء الأعمال قد تطور إلى تحليلات وعلم البيانات؛ فإن العديد من المورّدِين والباحثين لا يزالون يستخدمون 
هذا المصطلح. لذلك يولي القتسم 4-١‏ اهتمامًا بهذا التاريخ من خلال التركيز على ما LÀ‏ ذكاء الأعمال. 
وبعد القسم التاليء نقدّم التحليلات وسوف نستخدم ذلك كعلامة لتصنيف جميع المفاهيم ذات الصلة. 


أسئلة مراجعة على القسم Y-A‏ 
-١‏ اذكر ثلاثة من المصطلحات التي سبقت التحليلات. 


-Y‏ ما الفرق الأساسي بين elei‏ التي GÀ a‏ نظم المعلومات الإدارية ونظام دعم القرار ونظم 
المعلومات التنفيذية؟ 


Y‏ هل تطوّر نظامٌ دعم القرار إلى ذكاء أعمال أو العكس؟ 
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€-Y‏ إطار عمل ذكاء الأعمال: 

لقد تمّ ls‏ مفاهيم دعم القرار الواردة في القسمين ۲-۱ Y-‏ بشكلٍ تدريجي» تحت أسماء 
مختلفة من قبل العديد من المورّدين الذين قاموا بإنشاء أدوات وأساليب لدعم القرار. وكما 
Jar‏ في القسم 2-١‏ ومع S‏ النظم على نطاق المؤسسة؛ تمن المديرون من الوصول إلى تقارير 
سهلة الاستخدام تمكّنهم من اتخاذ القرارات بسرعة. وبدأت هذه الأنظمة: التي كانت تُسمّى 
عمومًا نظم المعلومات التنفيذية EISS‏ تقدم تصورًا Lla]‏ وتنبيهات» وقدرات لقياس الأداء. 
وبحلول عام ٠١٠۲م؛‏ ظهرت المنتجات والخدمات التجارية الرئيسة تحت مصطلح ذكاء الأعمال. 


تعريفات ذكاء الأعمال: 

ذكاء الأعمال (BI)‏ هو مصطلحٌ شامل يجمع بين البنيات والأدوات وقواعد البيانات والأدوات 
التحليلية والتطبيقات وا منهجيات. ويتزايد Sas‏ الشركات التي تقوم حالياً بتدريب موظفيها على 
أدوات تحليل الأعمال؛ من أجل تحقيق أكثر فعالية وكفاءة في عمليات صُنع القرارات اليومية وهناك 
نوع من الارتباك حول ذكاء الأعمال ناتج من موجة الاختصارات والكلمات الطنانة المرتبطة به (على 
سبيل المثال: إدارة أداء الأعمال ((BPM]‏ فالهدف الرئيس لذكاء الأعمال؛ هو تمكين الوصول التفاعلي 
dis‏ بعض الأحيان بشكلٍ فوري إلى البيانات» لتمكين معالجة البيانات» وإعطاء مديري الأعمال والمحلّلين 
القدرة على إجراء التحليلات المناسبة. ومن خلال تحليل البيانات التاريخية والحالية» والمواقف» 
والعروض» يستطيع صُناع القرار الحصول على رؤى قيّمة تمكّنهم من اتخاذ قرارات أفضل وأكثر استنارة. 
وتستند عملية ذكاء الأعمال إلى تحويل البيانات إلى laglea‏ ثم إلى قرارات» وأخيرًا إلى إجراءات. 


لمحة تاريخية عن ذكاء الأعمال: 

لقد صيعٌ glaa‏ ذكاء الأعمال من قبل مجموعة à Gartner‏ منتصف التسعينيات ومع ذلك 
وكما يشير التاريخ في القسم السابق؛ ob‏ هذا ا مفهوم أقدم من ذلك (iSo‏ وله جذوره في نظم تقارير 
5 ف السبعينيات. وخلال تلك الفترة؛ كانت نظم التقارير ثابتةء وكانت ثنائية الأبعاد وم تكن لديها 
قدرات تحليلية. às‏ أوائل الثمانينيات؛ ظهر مفهوم نظم المعلومات التنفيذية 5 وقد وسع هذا 
المفهوم الدعم المحوسب لدى JLS‏ المديرين والمديرين التنفيذيين. ومن بين الإمكانات التي las‏ 
التقارير الديناميكية المتعددة الأبعاد aahh!)‏ أو حسب الطلب) $4:J1‏ وتحليل الاتجاهات» وتحليل 
التفاصيلء والوصول إلى الحالةء وعوامل النجاح الحرجة. وقد ظهرت هذه الميزات في العشرات من 
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المنتجات التجارية حتى منتصف التسعينيات» ثم ظهرت نفس القدرات وبعض الإمكانات الجديدة 
تحت اسم ذكاء الأعمال. واليوم؛ يحتوي ذكاء الأعمال الجيد القائم على أساس نظام المعلومات 
المؤسسية على جميع المعلومات التي يحتاجها المسؤولون التنفيذيون في مجال المعلومات. لذلكء تم 
تحويل المفهوم الأصلي لنظام المعلومات التنفيذي EIS‏ إلى ذكاء الأعمال. وبحلول عام P-o‏ بدأت 
أنظمة ذكاء الأعمال لتشمل قدرات الذكاء الاصطناعي بجانب قدرات تحليلية قوية. ويُوضُح الشكل 
1-١‏ مختلف الأدوات والأماليب التي يمكن إدراجها في نظام ذكاء الأعمالء ويوضح كذلك تطور ذكاء 
الأعمالء وتبين الأدوات المعروضة في الشكل قدرات ذكاء الأعمال وتتوفر هذه القدرات في منتجات 
ذكاء الأعمال الأكثر تطورًا. وبعضها الآخر متخصص في بعض منها فقط. 






































الإستعلام 
J ETL‏ وإعداد التقارير 
i i‏ 
مستودع البيانات البيانات Aca i‏ 
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شكل :4-١‏ تطور ذكاء الأعمال (Bi)‏ 
بنية ذكاء الأعمال: 
تتكوّن بنية نظام ذكاء الأعمال من أربعة مكوّنات رئيسة هي: 
-١‏ مستودعات البيانات مع بيانات مصدرها. 
-Y‏ تحليلات الأعمالء وهي مجموعة أدوات معالجة وتنقيب وتحليل البيانات الموجودة 
في مستودعات البيانات. 
*- نظام إدارة الأعمال لمراقبة وتحليل الأداء. 
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£- واجهة مستخدم (على سبيل المثال: لوحة المعلومات). 
ويوضح الشكل ٠١-١‏ العلاقة بين هذه المكونات. 





ell‏ والإستراتيجية بيئة تحليلات الأعمال بينة مستودع البيانات 

















source: based on w.eckerson smart companies in the 21st century the secrets of creating. successful 
business intelligent sollutions. the data warehousing inistilute.seattle . wa.2003. p.32 iiiuslration 5 


شكل :٠١-١‏ بنية عالية المستوى لذكاء الأعمال 


أصول ومحركات ذكاء الأعمال: 

من أين أتت الطرق الحديثة المستودع البيانات وذكاء الأعمال؟ وما هي جذورها؟ وكيف تؤثر 
تلك الجذور على الطريقة التي تدير بها المنظمات هذه المبادرات اليوم؟ إن الاستثمارات الحالية في 
تقنية المعلومات تخضع لمزيدٍ من التدقيق من حيث تأثيرها على خط الأساس واحتماليتها. وينطبق 
الثيء نفسه على مستودعات البيانات وتطبيقات ذكاء الأعمال التي تجعل هذه المبادرات ممكنة. 

وتضطر المنظمات إلى استيعاب بياناتها وفهمها وتسخيرها لدعم القرارات لتحسين العمليات 
التجارية. فالقوانين والتنظيمات (مثل: قانون ساربينز - أوكسلي لعام (YY‏ تتطلب الآن من سير 
الأعمال توثيق عملياتهم التجارية والتوقيع على قانونية امعلومات التي يعتمدون عليها وتقديم 
تقرير إلى حاملي الأسهم. وعلاوةً على ذلك؛ أصبحت أوقات دورة الأعمال مضغوطة للغاية وأسرع 
وأكثر استنارةً وأصبحت هناك حاجة لاتخاذ قرار أفضلء وبالتالي» ele alj‏ المديرين إلى المعلومات 
الصحيحة في الوقت المناسب وفي المكان المناسب. وهذا هو شعار النهج الحديث لذكاء الأعمال. 

ويجب على المنظمات أن تعمل بذكاء مع الاهتمام البالغ بإدارة مبادرات ذكاء الأعمال 
التي Cile AS‏ ضروريًا من جوانب الأعمال. وليس feta‏ للدهشة أن pols‏ المنظمات بشكلٍ 
متزايد ذكاء الأعمال في تجسيدها الجديد كتحليلات. وتعرض حالة عملية ١-١‏ أحد تطبيقات 
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ذكاء الأعمال الذي ساعد العديد من شركات الطيران» وكذلك caudal‏ الشركات التي تقدم هذه 
الخدمات لشركات الطيران. 
حالة عملية 1-١‏ 
شركة Sabre‏ تساعد عملاءها من خلال لوحات المعلومات والتحليلات 
Sabre X 5$‏ واحدةً من الشركات العاممية الرائدة في صناعة الرحلات السياحية. 





وتقوم الشركة بتوفير الخدمات للأشخاص والشركات. وهي تخدمٌ المسافرين 





ووكلاء السفر والشركات ومورّدي خدمة السفر من خلال أربع شركات رئيسة 
هي: «Sabre Airline Solutionss «Sabre Travel Networks «Travelocity‏ 
JS iss .Sabre Hospitality Solutions g‏ البيئة الاقتصادية العاطية المتقلبة الحالية 
تحديات تنافسية كبيرة لصناعة الطيران. وللمُضْيّ u$‏ في ا منافسة» اعترفت شركة 
OL» Sabre Airline Solutions‏ المديرين التنفيذيين في شركات الطيران يحتاجون إلى 
أدوات iah‏ لإدارة قراراتهم التجارية والتخلّص من الإجراءات التقليدية واليدوية التي 
تستغرق Esg‏ طويلًا لجمع المعلومات المالية وغيرها من المعلومات اللازمة للمبادرات 
القابلة للتطبيق. liag‏ يتيح دعم القرار في الوقت ا مناسب لشركات الطيران في جميع 
أنحاء العام لتحقيق (sal‏ قدر من العائدات على المعلومات من خلال أفكار قيادية 
وذكاء LE‏ للتطبيقء وقيمة للعملاء من البيانات المتنامية. 

قامت شركة Sabre‏ بتطوير مستودع بيانات سفريات المؤسسة (ETDW)‏ 
باستخدام تيراداتا للاحتفاظ ببيانات الحجوزات الهائلة. ans‏ تحديث مستودع بيانات 
سفريات المؤسسة بشكلٍ فوري تقريبًا بدفعات تعمل كل ٠١‏ دقيقة. ولجمع البيانات 
من جميع الأعمال التابعة لشركة Sabre‏ وتستخدم Sabre‏ مستودع بيانات سفريات 
المؤسسة لإنشاء لوحات المعلومات التنفيذية التي توفر رؤى تنفيذية لحظية باستخدام 
منصة Cognos‏ ذكاء الأعمال مع -Oracle Goldengats Oracle Data Integrator‏ 
وتوفر لوحات المعلومات التنفيذية للمديرين وصُناع القرار رفيعي المستوى من شركات 
الطيران والعملاء حلًا Jeu GT‏ الاستخدام يجمع بين مقاييس الأداء الحساسة بطريقة 
موجزة وتقديم نظرة ثاقبة سريعة بدرجة YT‏ عن صحة شركة الطيران. às‏ إحدى 
شركات ol dall‏ توفر لوحات المعلومات التنفيذية لشركة Sabre‏ للإدارة العليا صورةً 
يومية ولحظية ممؤشرات الأداء الرئيسة في تطبيق واحد تحل محل العملية التي يتم 
إجراؤها مرة واحدةً في الأسبوع والتي تستغرق A‏ ساعات لتوليد التقرير نفسه من 
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مصادر البيانات المختلفة. إن استخدام اللوحات لا يقتصر على العملاء الخارجيين 
بل تستخدمها Sabre‏ أيضاً لتقييمها للآداء التشغيلي الداخلي. 

وتساعد لوحات المعلومات عملاء Sabre‏ على الفهم الواضح للبيانات من خلال 
شاشات العرض المرئية التي تتضمّن قدرات تفاعليةء يستبدل العروض التقدهية المسطحة 
ويسمح براجعة أكثر تركيرًا للبيانات بأقل جهد ووقت. هذا يُسهّل حوار الفريق من 
خلال إتاحة البيانات/ المقاييس المتعلقة بأداء المبيعات للعديد من المستفيدين ما في 
ذلك التذاكر والمقاعد المباعة والطيران والأداء التشغيلي ها في ذلك البيانات المتعلقة 
بحركة الطيران gala‏ وحجوزات العملاءء والمخازن, والإيرادات عبر توزيع شركة طيران 
متعددة القنوات. وتوفر أنظمة لوحة المعلومات البنية التحتية القابلة للتوسع ودعم 
واجهة المستخدم الرسوميةء وتكامل البيانات» والتجميع الذي ÉE‏ المديرين التنفيذيين 
في شركات الطيران من أن يكونوا أكثر إيجابية في اتخاذ إجراءات تؤدي إلى آثار إيجابية 
على الصحة العامة لشركات الطيران التابعة لهم. 

وباستخدام ETDW‏ الخاص بهاء تستطيع Sabre‏ كذلك تطوير حلول تحليلية 
وإعداد تقارير أخرى تستَندٌ إلى الويب» والتي تتيح الحصول على البيانات من أجل 
الحصول على رؤى العملاء من خلال تحليل الملفات الشخصية للعملاء وتفاعلات 
مبيعاتهم من أجل حساب قيمة العملاء. وهذا يتيح تقسيماً أفضل للعملاء وإحصاءات 
للخدمات ذات القيمة المضافة. 


أسئلة للمناقشة: 





-١‏ ما هي التقارير التقليدية؟ وكيف يتخ استخدامها في المنظمة؟ 

-Y‏ كيف يمكن استخدام التحليلات لتحويل التقارير التقليدية؟ 

-Y‏ كيف ose‏ للتقارير التفاعلية أن تساعد الشركات في gib‏ القرار؟ 

ما الذي الذي مكننا أن نتعلمه من هذه الحالة العملية؟ 

تُوضّح هذه الحالة العملية أن المنظمات التي استخدمت تقاريرها في cis‏ سابق فقط 
لتتبع أعمالها الداخلية وتلبية متطلبات التوافق التي وضعتها الحكومة تتجه الآن نحو 
توليد معلومات ذكية قابلة للتطبيق من بيانات معاملاتها التجارية. وقد أصبحت التقاريرٌ 
أكثر اتساعًا؛ إذ تحاول المنظمات الآن تحليل بيانات المعاملات المؤرشفة؛ لفهم التوجهات 
والأنماط الخفية الكامنة التي us‏ من اتخاذ قرارات أفضل من خلال اكتساب رؤى حول 
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المجالات التي تنطوي على مشكلات وحلها لمتابعة فرص السوق الحالية والمستقبلية. وقد 
تطورت التقارير إلى تقارير تفاعلية عبر الإنترنت» وهو ما هكن ا مستخدمين من الحصول 
على بيانات سريعة وإنشائهاء مساعدة أدوات التصوير التي لديها القدرة على الاتصال 
بقاعدة البيانات؛ مما يوفر إمكانيات التعمق في البيانات الملخّصة. 

Source: Teradata.com, "Sabre Airline Solutions,” Terry, D. (2011), "Sabre Streamlines 
Decision Making” — http://www.Teradatamagazine.com/v11n04/Features/Sabre- 


Streamlines-Decision-Making/(Accessed July 2016). 


استعمال الوسائط المتعددة فى ذكاء الأعمال: 

gas‏ شبكة جامعة تيراداتا TUN‏ مقاطع الفيديو (على غرار البرنامج التلفزيوني (CSI‏ لتوضيح 
مفاهيم التحليلات à‏ مختلف الصناعات. albis‏ عليها اسم «مقاطع فيديو iab‏ سيناريوهات 
الأعمال -«BSI‏ وهي ليست لجرد التسلية؛ ولكنها 2553 الفصل الدراسي ببعض الأسثلة للمناقشة. 
وبالنسبة للمبتدئينء يُرجَى الانتقال إلى: http//www.teradatauniversitynetwork.com/‏ 
Library/Items/BSI-The-Case-of-the-Misconnecting-Passengers‏ أو www.youtube.com/‏ 
watchtv-NXELSFA. aKA‏ ومشاهدة الفيديو الذي يظهر على يوتيوب. وعليك أن تفترض قيامك 
بدور مركز خدمة العملاء المهنية. وقد بدأت ale JI‏ القادمة في وقتِ متأخرء ومن ed A‏ أن يفقد 
العديد من الركاب رحلاتهم. وهناك icli‏ في رحلة مغادرة واحدة يمكن أن تستوعب اثنين من الركاب 
الأربعة. gb‏ من الركاب يجب أن as‏ إليه الأولوية؟ وينم إعطاؤك معلومات حول ملامح العملاء 
والعلاقات بشركة الطيران. وهنا قد تتغيرٌ قراراتك عندما تتعلم المزيد عن ملفات التعريف لهؤلاء العملاء. 

شاهد الفيديو وأوقفه كلما لزم الأمرء وأجب عن الأسئلة التي ينبغي أن يُعطَّى فيها الأولوية 
للمستفيدين. ثم استأنف مشاهدة الفيديو؛ للحصول على مزيد من المعلومات. وبعد اكتمال الفيديو 
يمكنك مشاهدة الشرائح المتعلقة بهذ! الفيديو وكيف تم alas)‏ التحليل على شريحة مُحدَّدة في: 
www.slideshare.net/teradata/bsi-how-we-did-it-the-case-of-the-misconnecting-passengers.‏ 

وتوفر هذه الرحلة المتعددة الوسائط مثالاً على LAS‏ مساعدة المعلومات الإضافية المتاحة 
من خلال مشروع مستودع البيانات DW‏ في صُنع القرار. 

على الرغم من أن البعض يساوي بين نظام دعم القرار وذكاء الأعمال؛ G‏ هذه الأنظمة 
ليست في الوقت الحاضر متساوية. المثير للاهتمام أن نلاحظ أن بعض الناس يعتقدون أن نظام 
دعم القرار DSS‏ هو جزءٌ من ذكاء الأعمال وإحدى أدواتها التحليلية. ويعتقد آخرون GE‏ ذكاء 
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الأعمال هو حالة خاصة من أنظمة دعم القرار التي تتناول في الغالب إعداد التقارير والتواصل 
والتعاون (شكل من أشكال أنظمة دعم الق رار ا موجهة بالبيانات). وة تفسير آخر قال به 
(Watson. 2005)‏ هو أن ذكاء الأعمال ما هو إلا نتيجة jahi‏ مستمرء وعلى هذا النحو؛ فإن 
نظام دعم القرار هو أحد عناصر ذكاء الأعمال الأصلية. وعلاوةً على ذلك وكما هو مُبيّن في 
القسم التالي وما بعده؛ نجد أنه وف العديد من الدوائرء تم دمج ذكاء الأعمال من خلال تحليلات 
مصطلحات جديدة أو علم البيانات. 
معالجة العمليات مقابل المعالجة التحليلية: 

لتوضيح الخصائص الرئيسة لذكاء الأعمال؛ سنقوم Sol‏ ببيان أن ذكاء الأعمال لا a$‏ معالجةٌ 
للمعاملات. إننا جميعًا على دراية بأنظمة المعلومات التي تدعم معاملاتناء مثل أجهزة الصراف 
«SI‏ والودائع ا مصرفيةء وفحص النقود في متجر البقالةء وما شابهها. وتشارك أنظمة معالجة 
العمليات هذه باستمرار في التعامل مع التحديثات فيما يمكن أن نسميه قواع د البيانات 
التشغيلية. فعلى سبيل المثال: في عملية السحب من أجهزة الصراف «SI‏ نكون بحاجة إلى 
تقليل رصيدنا المصرفي وفقاً لذلك؛ في حين T‏ الإيداع البنكي يضيف إلى الحساب. ومن المرجّح أن 
تظهر مشتريات متجر البقالة في حساب المتجر من خلال إجمالي المبيعات لهذا اليوم وينبغي أن 
تعكس تخفيضاً مناسباً في المخزون من الأصناف التي اشتريناها وهكذا. وتعالج أنظمة معالجة 
العمليات الفورية هذه (OLTP)‏ نشاط الشركة المعتاد والمستمر. وعلى النقيض من ذلك؛ فإن 
مستودع البيانات يكون Bale‏ نظامًا sa Gaata‏ التخزين للبيانات التي سيتم استخدامها للتحليل. 
والقصد من هذا التحليل؛ هو إعطاء الإدارة القدرة على تنظيف البيانات للحصول على معلومات 
عن الأعمال» ويمكن استخدامها لتوفير الدعم التكتيكي أو التنفيذي للقرار؛ إذ GS‏ للمديرين 
المباشرين» على سبيل JELI‏ اتخاذ قرارات أسرع و/أو أكثر استنارة. وسوف نقدّم تعريقًا أكثر 
iuis‏ لمستودع OLLI‏ في الفصل GUI‏ ولكن يكفي أن نقول بأن مستودعات البيانات تهدف 
إلى العمل مع البيانات المعلوماتية odaá ubl‏ في نظم المعالجة التحليلية الفورية (OLAP)‏ 
629 تخزين معظم البيانات التشغيلية في نظم تخطيط موارد المؤسسة (ERP)‏ وفي أشقائها 
التكميليين» مثل إدارة سلسلة التوريد (SCM)‏ أو نظام إدارة العملاء (CRM)‏ 4554 في نظام 
معالجة العمليات الفورية OLTP‏ وهو نوعٌ من معالجة الحاسوب حيث يستجيب الحاسوب 
فورًا لطلبات المستخدمين. alza callo JS Asio‏ وهو Jau‏ محوسب لحدثْ منفصلء مثل 
استلام المخزون أوامر العميل. وبعبارة أخرى؛ تطلب المعاملة مجموعة من اثنين أو أكثر من 
تحديثات قاعدة البيانات التي يجب أن تكتمل بطريقة US‏ شيء أو لا شيء. 
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إن التصميم الذي يجعل نظام OLTP‏ هذا Vis‏ لمعالجة العمليات يجعله غير فعال بالنسبة 
للتقارير والاستعلامات والتحليلات الخاصة بالمستخدم النهائي. وف الثمانينيات» أشار العديدٌ من 
المستخدمين من رجال الأعمال إلى إطاراتهم الرئيسة على أنها «ثقوب سوداء» JS QS‏ المعلومات 
دخلت إليهاء ولكن لم يرجع (Sl‏ منهم على الإطلاق. ويجب أن يبرمج موظفو تقنية المعلومات 
جميع طلبات تقديم التقارير, في حين أنه يمكن إصدار التقارير «المسبقة أو الأكثر استخداما» 
وحدها على أساس مجدولء إن الاستعلام الفوري المخصص مستحيل تقريبًا. وعلى الرغم من أن 
نظم تخطيط موارد المؤسسات القائمة على العميل/ الخادم في التسعينيات كانت أكثر ملاءمة 
لإعداد التقارير؛ فإنها ما زالت بعيدة كل البعد عن الاستخدام المرغوب فيه من قبل المستخدمين 
النهائيين وغير التقنيين لأمور مثل إعداد التقارير التشغيلية والتحليل التفاعلي وما إلى ذلك. dads‏ 
هذه القضايا؛ تمّ إنشاء مفاهيم مستودع البيانات وذكاء الأعمال. 

وتحتوي مستودعات البيانات على مجموعة واسعة من البيانات التي تقدّم صورةً متماسكة 
لأوضاع الأعمال في وقتٍ واحد. وكانت الفكرة هي إنشاء بنية تحتية لقاعدة البيانات التي كانت داتمًا 
على شبكة الإنترنت وتتضمّن جميع المعلومات من أنظمة Le OLTP‏ في ذلك البيانات التاريخية, 
ولكن أعيد ترتيبها وتنظيمها بطريقة سريعة وفعّالة للاستفسار والتحليل ودعم القرار. إن فصل 
OLTP‏ عن التحليل ودعم القرار تمن من الاستفادة من ذكاء الأعمال وهو ما وصفناه في وقتِ سابق. 
التخطيط المناسب والتوافق مع إستراتيجية الأعمال: 

أولاً وقبل US‏ شيء» يجب أن تكون الأسباب الأساسية للاستثمار في ذكاء الأعمال متوافقةًٌ مع 
إستراتيجية أعمال الشركة. إِنَّ ذكاء الأعمال ليس مجرد ممارسة تقنية لقسم نظم المعلومات؛ بل 
يجب أن يكون AL, as‏ لتغيير الطريقة التي تقوم بها الشركة التجارية من خلال تحسين عملياتها 
التجارية وتحويل عمليات صنع القرار؛ لتكون AZ‏ إلى Ao‏ كبير على البيانات. ويشير العديدُ من 
استشاريي وممارسي ذكاء الأعمال الذين يشاركون في مبادرات ذكاء الأعمال الناجحة إلى أن إطار 
التخطيط هو شرطٌ rua‏ ضروري. يقوم أحد إطارات العمل الذي تم تطويره بواسطة مجموعة 
جارتتر )2004( Gartner‏ بتحليل وتخطيط وتنفيذ مكونات الأعمال والمنظمة والوظائف والبنية 
التحتية. وعلى مستوى الأعمال والمستويات التنظيمية؛ يجب تحديدٌ الأهداف الإستراتيجية 
والتشغيلية مع مراعاة المهارات التنظيمية المتاحة لتحقيق تلك الأهداف. ويجب على الإدارة 
العليا أن تنظر في قضايا الثقافة التنظيمية التي تحيط بمبادرات ذكاء الأعمال وحفز تلك المبادرات 
والإجراءات المتعلقة مشاركة أفضل ممارسات ذكاء الأعمال المتبعة في الإدارة العليا داخل الشركة 
مع وَضْع الخطط اللازمة لإعداد المنظمة من أجل التغيير. ومن بين الخطوات الأولى في هذه 
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العملية تقييم تنظيم نظام ا معلومات ومجموعات مهارات الفئات المحتملة من المستخدمينء 
وما إذا كانت الثقافة LG‏ للتغيير. ومن خلال هذا التقييم» وعلى افتراض وجود مبرر/ ضرورة 
للمُضي KÈ‏ هكن للشركة olas)‏ خطة عمل مفصلة. Ñg‏ مسألة حاسمة أخرى لنجاح تنفيذ 
نظم المعلومات وهي gis‏ العديد من مشاريع ذكاء الأعمال (حيث تستخدم معظم المؤسسات 
العديد من مشاريع ذكاء الأعمال) فيما بينها من جانب ومع أنظمة تقنية المعلومات الأخرى في 
المنظمة وشركائها التجاريين من جانب آخر. 
من الحكمة البدهٌ في استخدام ذكاء الأعمال وإنشاء مركز كفاءة ذكاء الأعمال إذا كانت إستراتيجية 
الشركة تتماثى بشكل صحيح مع أسباب مبادرات مستودعات البيانات وذكاء الأعمالء وإذا كان نظام 
ا معلومات 15308 أو بإمكانه القيام بدوره في مثل هذا المشروع, وإذا كان مجتمع المستخدمين المستهدّف 
موجوداً ولديه الدافعية؛ حينها بإمكان المركز أن يقدم الخدمات التالية )2004 x(Gartner.‏ 
- هكن للمركز أن يُوضُّح كيف يرتبط ذكاء الأعمال بالإستراتيجية وتنفيذ الإستراتيجية. 
- يمكن أن يعمل ا مركز على تشجيع التفاعل بين مجتمعات مستخدمي الأعمال المحتملين وتنظيم نظم المعلومات. 
- يمكن للمركز أن يعمل كمستودع ومُورّع لأفضل ممارسات ذكاء الأعمال بين مختلف خطوط الأعمال. 
- يمكن للمركز تأسيسٌ معايير Hal‏ في ممارسات ذكاء الأعمال وتشجيعها من خلال الشركة. 
- هكن أن eles‏ منظمات نظم المعلومات الكثير من خلال التفاعل مع مجتمعات المستخدمين» 
مثل المعرفة حول مجموعة متنوعة من الأدوات التحليلية المطلوبة. 
oo -‏ مستخدمي الأعمال التجارية ومنظمات نظم المعلومات من فهم أفضل للسبب الذي يستوجب 
أن تكون منصة مستودع البيانات ipo‏ ا فيه الكفاية لتوفير متطلبات العمل المتغيرة. 
ose -‏ أن تساعد حاملي الأسهم ال مهمينء مثل المديرين التنفيذيين رفيعي المستوى؛ على فهم كيف 
يمكن أن يلعب 253 الأعمال دورًا مهمًا. 
ومن عناصر ذكاء الأعمال الأخرى الناجحة قدرته على توفير بيئة فاعلة سنعرضها فيما يلي: 





ذكاء الأعمال الفوري وعند الطلب أصبح متاحاً: 

لقد تزايدت الحاجة إلى الوصول الفوري إلى المعلومات المشتتة £o‏ على الطلب من أجل 
سد الفجوة بين البيانات التشغيلية والأهداف الإ تراتيجيةء وهو الأمر الذي أصبح أكثر إلحاحًا. 
ونتيجةً لذلك؛ ظهرت فئةٌ من المنتجات تُسمّى تطبيقات ذكاء الأعمال الفورية. ومن شأن إدخال 
تقنيات جديدة لتوليد البيانات» Jio‏ تقنية RFID‏ وغيرها من أجهزة الاستشعارء أن يؤدي إلى 
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تسريع هذا النموٌ وتلبية الحاجة إلى ذكاء الأعمال بشكل فوري. وتستخدم أنظمة ذكاء الأعمال 
التقليدية قدرًا D$‏ من البيانات الثابتة التي تم استخراجها وتنقيتها وتنزيلها إلى مستودع 
البيانات لإنتاج التقارير والتحليلات. ومع ذلك؛ فإن الحاجة ليست مجرد إعداد التقرير؛ OS‏ 
المستخدمين يحتاجون إلى مراقبة الأعمال» وتحليل الأداءء وفهم اذا تحدث الأمور. وهذا هكن أن 
يساعد ا مستخدمين» الذين يحتاجون أن يعرفوا (تقريبًا بشكل فوري) معلومات عن التغييرات في 
البيانات أو توذر التقارير ذات الصلةء والتنبيهات» والإخطار بشأن الأحداث والاتجاهات الناشئة 
في تطبيقات وسائل التواصل الاجتماعي. وبالإضافة إلى ذلك؛ يمكن برمجة تطبيقات الأعمال 
للعمل على ما تكتشفه أنظمة ذكاء الأعمال هذه في الوقت المناسب. على سبيل المثال: قد يقوم 
(SCM)‏ بتقديم qb‏ تلقاني؛ للحصول على المزيد من «الأدوات» عندما يكون المخزون أقلّ 
من 42 معين أو حينما يقوم نظام خدمة العملاء بتنبيه ممثل خدمة العملاء وموظف مراقبة 
الائتمان للتحقق من عملية عبر الإنترنت قيمتها تجاوزت ٠٠٠٠١‏ دولار. 

من الطرق التي يستخدمها ذكاء الأعمال لتوفير البيانات في الوقت المناسب نموذج مستودع 
البيانات الذي تستخدمه أنظمة ذكاء الأعمال التقليدية. وفي هذه الحالة؛ si‏ ا منتجات التي 
يقدّمها مورّدو منصة ذكاء الأعمال المبتكرة حلا موجهًا بالخدمة وبشكل فوري تقريبًاء والذي 
يقوم بتعبئة مستودع البيانات (DW)‏ بشكل أسرع مما يقوم به التحديث الدوري التقليدي من 
استخراج/ نقل/ تنزيل (انظر الفصل (Y‏ الطريقة الثانية تُسمّى بإدارة نشاط الأعمال (BAM)‏ 
e‏ استخدامه من قبل مورّدي BAM‏ و/أو مورّدي وسطاء L&« BAM‏ (مثل: Savvion‏ أو 
برنامج Iteration‏ أو Vitria‏ أو webMethods‏ أو Quantive‏ أو Tibco‏ أو (Vineyard‏ وهو 
يتجاوز مستودع البيانات تمامًا ويستخدم خدمات الويب أو غيرها من وسائل الرّصد لاكتشاف 
الأحداث التجارية الرئيسة. ويمكن وَضْع أجهزة مراقبة البرنامج (أو وكلاء الذكاء) على خادم 
منفصل في الشبكة أو في قواعد بيانات تطبيقات العمليات نفسهاء ويمكنهم استخدام الأساليب 
القائمة على العمليات؛ من أجل قياس العمليات التشغيلية بشكل استباقي وبذكاء. 
تطوير أو حيازة أنظمة ذكاء الأعمال: 

aliis اليوم العديد من المورّدين أدواتٍ متنوعةً البعض منها مبرمجٌ بشكلٍ كاملٍ‎ eX 
وکل ما يجبٌ على المستخدم فعله هو إدخال الأرقام الخاصة به. ويمكن شراء هذه‎ Shells lle 
الأدوات أو تأجيرها. وللحصول على قائمة بالمنتجات والعروض التوضيحية والمزيد من المعلومات‎ 
وما‎ -tdwi.org عن المنتجات الحاليةء انظر أدلة المنتج على موقع معهد مستودعات البيانات‎ 
عليك إلا أن تقوم بتسجيل المستخدم مجانًا. ويتمٌ إنشاء جميع تطبيقات ذكاء الأعمال تقريبًا مع‎ 
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shells‏ والتي يوفرها المورّدون أنفسهم الذين يقومون بإنشاء da‏ مخصص للعميل أو العمل مع 
مورّد آخر يستعين بمصادر خارجية. Ó‏ المشكلة التي تواجهها الشركات هي اختيار البديل: الشراء 
أو الإيجار أو الإنشاء. ولكلٌ من هذه البدائل Bae‏ خيارات» ومن بين المعايير الرئيسة لاتخاذ 
القرار؛ هو التحليل وتحليل التكلفة والمنافع. 
الضبط وتحليل التكاليف والمنافع: 

مع زيادة عدد تطبيقات ذكاء الأعمال المحتملة؛ تنشأ الحاجة إلى ضبطها وتحديد أولوياتها. 
وهذه ليست مهمة سهلة بسبب العدد الكبير من الفوائد غير المباشرة؛ إذ يجبٌ تحديد الفوائد 
المباشرة وغير المباشرة. وبطبيعة الحال؛ Ó‏ ذلك يحدث عندما تكون معرفة تطبيقات مختلفة 
في المنظمات الأخرى ودراسات الحالة مفيدة للغاية. على سبيل المثال: يوفر معهد مستودعات 
البيانات (tdwi.org)‏ ثروة من المعلومات عن المنتجات والتطبيقات والتطبيقات المبتكرة. ويمكن 
أن تكون هذه المعلومات مفيدة في تقدير الفوائد المباشرة وغير المباشرة. 
أمن وحماية الخصوصية: 

هذه مسألةٌ مهمةٌ للغاية في تطوير G‏ نظام محوسبء وخاصةً ذكاء الأعمال الذي يحتوي على 
البيانات التي قد يكون لها قيمة إستراتيجية. وكذلك يجب حماية خصوصية الموظفين والعملاء. 
تكامل الأنظمة والتطبيقات: 

باستثناء بعض التطبيقات الصغيرة؛ يجب تكامل جميع تطبيقات ذكاء الأعمال مع أنظمة 
أخرى» مثل: قواعد البيانات» والأنظمة القدهة. ونظم المؤسسة (خاصةً (CRMs ERP‏ والتجارة 
الإلكترونية (البيع والشراء)؛ بل وأكثر من ذلك. وبالإضافة إلى ذلك؛ فإن تطبيقات ذكاء الأعمال 
ترتبط Gale‏ بالإنترنت وفي أحيان كثيرة بنظم معلومات شركاء الأعمال. 

By es‏ على ذلك؛ تحتاج أدوات ذكاء الأعمال أحيانًا إلى التكامل والدعم فيما بينها. وقد 
دفعت الحاجة إلى التكامل مورّدي البرامج إلى إضافة قدراتهم باستمرار إلى منتجاتهم. إن العملاء 
الذين يشترون حزمة البرمجيات المتكاملة يتعاملون مع مورّد واحد Jai‏ ولا يحتاجون إلى التعامل 
مع أنظمة أخرى. ولكنهم قد يفقدون 83s‏ إنشاء نظم تتألف من مكونات «من سلالة أفضل». 
أسئلة مراجعة على القسم :6-١‏ 
-١‏ عرّف ذكاء الأعمال. 
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-Y‏ اذكر مع الشرح المكونات الرئيسة لذكاء الأعمال. 
*- عرّف .OLTP‏ 
£- عرّف .OLAP‏ 
0- اذكر بعض مجالات التنفيذ التي تناولها تقرير „Gartner‏ 
1 اذكر بعض عوامل النجاح الأخرى لذكاء الأعمال. 
0-١‏ نظرة عامة على التحليلات: 
لقد clo‏ كلمة التحليلات إلى 39 كبير محل SS‏ الفردية السابقة لتقنيات دعم القرار 
المحوسبة التي كانت متوفرةً تحت تسميات مختلفة في الماضي. وفي الواقع؛ فإن العديد من 
الممارسين والأكادهيين الآن يستخدمون كلمة التحليلات بدلا من ذكاء الأعمال. des‏ الرغم من أن 
العديد من المؤلفين والاستشاريين عرّفوها بشكلٍ مختلف قليلاً؛ فقد يُنظر إلى التحليلات على أنها 
عملية وضع قرارات قابلة للتطبيق أو توصيات لاتخاذ إجراءات El‏ على رؤى متولدة من البيانات 
التاريخية. ووفقاً لمعهد بحوث العمليات وعلوم الإدارة oj (INFORMS)‏ التحليلات تمثل مزيجاً 
من تقنيات الحاسوبء وتقنيات SYI ele‏ والإحصاءات dod‏ مشكلات حقيقية. وبطبيعة الحال؛ 
فقد اقترحت منظمات أخرى كثيرة تفسيراتها ودوافعها للتحليلات. فعلى سبيل المثال: اقترح معهد 
5 نمانية مستويات من التحليلات تبدأ بتقارير موحّدة من النظم الحاسوبية وتوفر هذه التقارير 
وصفاً لما يحدث داخل المنظمة: وقد Luka‏ التقنيات الإضافية من إنشاء تقارير مُخصّصة بتفاصيل 
أكثر. ويعود التطؤر JE‏ في إعداد التقارير إلى طلبات البحث من نوع ا معالجة التحليلية الفورية 
التي تسمح للمستخدم بالاستكشاف بشكل أعمق وتحديد مصادر معينة للمشكلات أو الفرص. 
التقنيات المتاحة اليوم لديها القدرة على إصدار تنبيهات لصناع القرار حينما يسوء الأداء على 
سبيل JEL‏ وقد تكون هذه التنبيهات للمستهلك فيما يتعلق بالطقس أو قضايا أخرى. ولكن 
يمكن على غرار ذلك إنشاء التنبيهات في سياق إعدادات معينة عندما تكون المبيعات أعلى أو أقل 
من مستوى معين خلال فترة زمنية معينة أو عندما يكون المخزون ممنتج معين منخفضاً. وكل 
هذه التطبيقات تكون ممكنةً من خلال تحليل البيانات التي يتم جمعها من قبل منظمة ماء وقد 
S‏ هذا التحليل تحليلاً إحصائياً لفهم الأماط بشكل أفضل. ويمكن بعد ذلك اتخاذ خطوة 
أخرى لتطوير التنبؤات أو نماذج للتنبؤ بكيفية استجابة العملاء لحملة تسويقية معينة أو عروض 
خدمات/ منتجات مستمرة. وعندما تكون لدى المنظمة رؤية جيدة ما يحدث وما قد يحدثء 
يمكنها أيضاً أن تستخدم أساليب أخرى لإصدار أفضل القرارات في ظل الظروف القائمة. vicis‏ 
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على ثمانية مستويات للتحليلات ولمزيدٍ من التفاصيل بالإمكان النظر في العرض التوضيحي المقدّم 
من معهد SAS‏ على الرابط: -(sas.com/news/sascom/analytics levels.pdf)‏ 

ولقد od er‏ هذه الفكرة المتمثلة في دراسة البيانات بشكل كامل لفهم ما يحدث» وما 
سيحدث. وكيفية تحقيق أفضل استفادة منها في اقتراح ثلاثة مستويات من التحليلات. وتم 
تحديدٌ هذه المسنويات الثلاثة (المعلوماتية/ المجتمعية/ التحليلية) على duos uil‏ وتنبؤية. 
وتوجيهية. يعرض الشكل ١١-١‏ عرضاً GU‏ لأنواع التحليل الثلاثةء ويشير إلى أن هذه المستويات 
الثلاثة مستقلةٌ إلى حَدَّ ماء وأن $S‏ منها يؤدي إلى الآخر. كما يشير إلى وجود بعض التداخل عبر 
هذه الأنواع الثلاثة من التحليلات. وسواءً كانت مستقلةً أو متداخلةٌ؛ فإن الطبيعة المترابطة 
لمختلف أنواع التحليلات واضحة وسيتم شرح المستويات الثلاثة في الأقسام التالية. 





ماذا ينبغى أن أفعل؟ ماذا سيحدث؟ ماذا حدث؟ z‏ 
لماذا ينبغى أن أفعله؟ لماذا سيحدث nau T‏ كك 


الأمثلية ‏ ر التنقيب فى Cyl‏ ر إعداد تقارير الأعمال 
المحاكاة ر التنقيب فى yapa‏ 7 لوحات المعلومات 


الأدرات المساعدة 
SNN‏ 


نمذجة القرار >“ التنغيب فى وسال الاعلامالويب ‏ بطاقات النتائج 
النظم Vall‏ التنبؤات d‏ مستودعات CAAM‏ 
أفضل قرارات A paai y‏ توقعات مستقبلية دقيقة مشاكل وفرص 
الأعمال الممكنة اللأحداث والنتائج عمل محددة جيدا 3 











الشكل :!١-١‏ أنواع التحليلات الثلاثة 
التحليلات الوصفية: 


pis‏ التحليلات الوصفية (أو التقارير) إلى معرفة ما يحدث في ا منظمة وفهم بعض الاتجاهات 
والأسباب الكامنة وراء مثل هذه التجارب. ينطوي ذلك على توحيد مصادر البيانات وتوفر 
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جميع البيانات ذات الصلة في شكل يتيح إعداد التقارير والتحليلات المناسبةء Bale‏ ما يكون 
تطوير هذه البنية الأساسية للبيانات جزءًا من مستودعات البيانات. ومن هذه البنية الأساسية 
للبيانات هكننا تطويرٌ التقارير المناسبة» والاستعلامات» والتنبيهات» والاتجاهات باستخدام أدوات 
وأساليب إعداد التقارير المتنوعة. 

من التقنيات المهمة التي تشكل لاعباً أساسيًا في مجال التحليلات الوصفية؛ التصويرٌ باستخدام 
أحدث أدوات التصوير في السوقء والتي تمكّننا من استخراج رؤى قوية من عمليات منظماتنا. 
i .(dssbibook.com)‏ 


حالة عملية Y-‏ 
شركة سيلفاريس oss (Silvaris)‏ أعمالها باستخدام التحليل «ll‏ وإمكانيات إعداد التقارير الفورية 
تأسّست شركة Silvaris‏ في عام ١٠٠۲م‏ من قبل فريق من اللمتخصّصين في صناعة 
أخشاب الغابات لتوفير eX]‏ التقني في قطاع الخشب ومواد البناء. Silvaris Ass‏ 
dsl‏ منصة للتجارة الإلكترونية في الولايات المتحدة الأمريكية خصيصاً لمنتجات الغابات» 
ويقع laio‏ الرئيس في سياتل. واشنطن. وهي شركة رائدة في مجال توفير المنتجات 
الخشبية الصناعية وفائض مواد البناء. 
تقوم e zo Silvaris‏ منتجاتها ess‏ خدمات لوجيستية دولية إلى أكثر من Yose‏ 
عميل. ولإدارة مختلف العمليات ذات الصّلة بالمعاملات؛ أنشأت منصة تداول عبر الإنترنت 
بحقوق ملكية لتتبع تدفق المعلومات المتعلّقة با معاملات بين التجار والمحاسبة والائتمان 
والخدمات اللوجستية. وقد أتاح ذلك للشركة تبادل المعلومات بشكل فوري مع عملائها 
والشركاء. ولكن نظراً sz‏ السريع في أسعار المواد؟ أصبح من الضروري أن تحصل Silvaris‏ 
على عرض فوري للبيانات دون الحاجة إلى نقل وتنسيق البيانات في تقرير منفصل. 
وبدأت 315 بالاستعانة بشركة تابلوه s(Tableau)‏ لقدرتها على التواصل مع 
البيانات الحية وتصويرها. وبسبب لوحات المعلومات التي أنشأتها تابلوه (Tableau)‏ 
والتي تتسم بسهولة الفهم والشرح؛ بدأت Silvaris‏ باستخدام تأبلوه (Tableau)‏ 
لأغراض إعداد التقارير. وساعد ذلك Silvaris‏ في سحب المعلومات بسرعة من البيانات 
وتحديد القضايا التي تؤثر على أعمالها. ونجحت Silvaris‏ في إدارة الطلبات عبر الإنترنت 
مقابل الطلبات الأخرى بمساعدة التقارير التي أنشأتها تابلوه (Tableau)‏ والآن؛ تقوم 
5 بتتبّع الطلبات عبر الإنترنت المقدمة من قبل العملاء وتعرف متى ترسل دفعات 
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تجديد للعملاء الذين يقومون بالشراء عبر الإنترنت. وأيضاً هكن محللي Silvaris‏ توفير 
الوقت من خلال توليد coles!‏ معلومات as‏ من كتابة Ole‏ الصفحات من التقارير 
باستخدام تابلوه (Tableau)‏ 

أسئلة للمناقشة: 

3Silvaris ما التحدي الذي واجهته‎ -١ 

(Tableau) كيف حلت 35 مشكلتها باستخدام تصوير البيانات مع تابلوة‎ -Y 

Ilo‏ يمكننا أن glei‏ من هذه الحالة العملية: 

تحتاج العديد من الصناعات إلى تحليل البيانات بشكل فوري. ويتيح التحليلٌ 
الفوري للمحللين تحديد القضايا التي تؤثر على أعمالهم. ويكون التصويرٌ أحيانًا أفضل 
طريقة لبدء تحليل تيارات البيانات الحية. i59‏ تابلوه (Tableau)‏ إحدى أدوات 
تصوير البيانات ذات القدرة على تحليل البيانات الحية دون نقل البيانات الحية إلى 
تنسيق تقارير منفصل. 
Sources: Tableau.com, "Silvaris Augments Proprietary Technology Platform with‏ 
Tableau's Real-Time Reporting Capabilities" http://www.tableau.com/sites/default/‏ 
files/case-studies/silvarisbusiness-dashboards 0.pdf (accessed July 2016); Silvaris.‏ 

com, "Overview; http://www.silvaris.com/About/(accessed July 2016). 
Y-3 عملية‎ di» 
التكلفة باستخدام تصوير البيانات‎ Jas (Siemens) شركة سيمنس‎ 

شركة سيمنس (Siemens)‏ هي شركة أطانية مقرّها في برلين. أطانياء وهي إحدى 
كبرى الشركات في العام التي ترگز على مج الات الكهرباءء. والسيارات, والرقمنة. 
وتحقق إيرادات سنوية تبلغ V‏ مليار يورو. 





ويتم تنفيذ مجموعة التحليلات المرئية لشركة سيمنس (Siemens)‏ بحل ول التقارير 
الشاملة والاستشارات فيما يتعلق بجميع احتياجات ذكاء الأعمال الداخلية لشركة سيمنس 
(Siemens)‏ وكانت هذه المجموعة تواجه تَحَذَّياً متمثلاً في توفير حلول إعداد التقارير إلى 
منظمة سيمنس (Siemens)‏ بالكامل عبر الأقسام المختلفة مع الحفاظ على التوازن بين قدرات 
الحوكمة والخدمة الذاتية. وكانت شركة سيمنس (Siemens)‏ بحاجة إلى منصة eS‏ من 
تحليل الحالات المتعددة لاستطلاعات آراء العملاء والعمليات اللوجيستية» وإعداد التقارير 
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المالية. وكان لا بد أن تكون هذه المنصة ilgu‏ الاستخدام لموظفيها؛ حتى lys‏ من استخدام 
هذه البيانات للتحليل واتخاذ القرارات. وبالإضافة إلى ذلك؛ يجب أن تتكامل المنصة بسهولة 
مع أنظمة سيمنس (Siemens)‏ الحاليةء ols‏ تمنح الموظفين تجربة استخدام سلسة. 

بدأت الشركة في الاستعانة بشركة Dundas BI‏ وهي مورد ble‏ رائدٌ لحلول ذكاء 
الأعمال وحلول التمثيل البصري للبيانات» وقد سمح ذلك لشركة سيمنس (Siemens)‏ 
بإنشاء لوحات معلومات تفاعلية cx.‏ شركة سيمنس (Siemens)‏ من اكتشاف 
المشكلات مبكرًاء وبالتالي توفير قدر كبير من المال. وساعدت لوحات المعلومات التي 
طوّرتها Dundas BI‏ شركة سيمنس (Siemens)‏ على الإجابة عن أسئلة Jis‏ كيف تؤثر 
معدلات العرض المختلفة في المواقع المختلفة على العملية؛ مما ساعدها على تقليل زمن 
دورة الأعمال بمقدار ZAY‏ وتكلفة الخردة بنسبة VO‏ 

أسئلة للمناقشة: 

-١‏ ما التحديات التي واجهتها مجموعة سيمنس (Siemens)‏ للتحليلات المرئية؟ 


(Siemens) شركة سيمنس‎ Dundas BI كيف ساعدت أداة تصوير البيانات من‎ -Y 
خفض التكلفة؟‎ à 

ماذا us$‏ أن نتعلم من هذه الحالة العملية: 

تحتاج العديدٌ من المنظمات إلى أدوات lys‏ من تحليل بياناتها المتوفرة في أقسام 
متعددةء هذه الأدوات تساعد في تحسين أداء عمل المنظمات. وجَعْل عملية اكتشاف 
البيانات FOES‏ بالنسبة للمستخدمين؛ لتمكينهم من تحديد مشكلات الأعمال بسهولة. 
Sources: Dundas.com, "How Siemens Drastically Reduced Cost with Managed BI‏ 
Applications; http://www.dundas.com/resource/getcasestudy?caseStudyName-09-03-‏ 
2016-SiemensX2FDundas-BI-Siemens-Case-Study.pdf (accessed July 2016); Wikipedia.‏ 


org, "SIEMENS; https;//en.wikipedia.org/wiki/Siemens (accessed July 2016); Siemens. 
com, "About Siemens,” http://www.siemens.com/about/en/(accessed July 2016). 


التحليلات التنبؤية: 

تهدف التحليلات التنبؤية إلى تحديد ما يمكن أن يحدث ف المستقبلء وتعتمد هذه التحليلات 
على الأماليب الإحصائية بالإضافة إلى الأماليب الأخرى التي تم تطويره ا É>‏ والتي تندرج 
تحت الفئة العامة التنقيب في البيانات. وتهدف هذه التقنيات إلى القدرة على التنبق ا إذا 
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كان من المرجح أن ينتقل العميلٌ إلى المنافسينء وماذا يجب على العميل شراؤه بعد ذلك dos‏ 
مقدارء وما هي العروض الترويجية التي قد يستجيبٌ لها العميلء وما إذا كان هذا العميل جديراً 
بالثقة الائتمانية أم Y‏ وما إلى ذلك. العديدٌ من التقنيات تُستخدّم في تطوير تطبيقات التحليلات 
التنبؤية Le‏ في ذلك خوارزميات التصنيف المختلفة. فعلى سبيل JEL‏ وكما سنرى في الفصلين 
الرابع والخامسء lcg‏ استخدام تقنيات التصنيف مثل الانحدار اللوجستي» ونماذج شجرة 
القرارات» والشبكات العصبية للتنبؤ بمدى جودة الصور المتحركة أمام شباك التذاكر. وهكننا 
أيضاً استخدامٌ خوارزميات التجميع لتقسيم العملاء إلى مجموعات مختلفة؛ حتى يكون بالإمكان 
استهدافهم بعروض ترويجية Boo‏ لهم. duds‏ يمكننا استخدامٌ أساليب الترابط في المجتمعات 
لتقدير العلاقات بين السلوكيات الشرائية ال مختلفة sis]‏ إذا اشترى أحد العملاء منتجًا ما؛ فما 
الذي قد يشتريه العميل أيضاً؟ هكن أن يساعد هذا التحليل بائع التجزئة في التوصية أو الترويج 
للمنتجات ذات الصلة. على سبيل JES‏ فإن أيّ بحث عن منتج على Amazon.com‏ ينتج عنه 
أن يقترح بائعٌ التجزئة أيضاً منتجات مشابهة أخرى قد يهتم بها العميل. وسنقوم بدراسة هذه 
الأساليب وتطبيقاتها في الفصول من الثالث إلى السادس. وتوضّح الحالة العملية 6-١‏ إحدى هذه 
التطبيقات في الألعاب الرياضية. 
حالة عملية ٤-١‏ 
تحليل الإصابات الرياضية 
إن il‏ نشاط رياضي يكون ise‏ لوقوع إصابات وإذا م يتم التعامل مع الإصابات 

بشكلٍ صحيح؛ فقد يتضرّر الفريق. ويمكن أن يساعد استخدام التحليلات لفهم الإصابات 

في الحصول على إحصاءات قيّمة من شأنها تمكين المدربين وأطباء الفريق من إدارة 

تكوين الفريق» وفهم قدرات اللاعبينء والمساعدة في نهاية المطاف في اتخاذ القرارات 

الأفضل بشأن اللاعبين الذين رها يكونوا متاحين للعب في (Sl‏ وقت. 

di‏ دراسة استطلاعية؛ قامت جامعة أوكلاهوما الحكومية بتحليل الإصابات 

الرياضية بكرة القدم الأمريكية باستخدام التقارير والتحليلات التنبؤية. واتبع المشروع 

منهجية CRISP-DM‏ (التي سنعرضها في الفصل الرابع)؛ لفهم مشكلة تقديم توصيات 

بشأن إدارة الإصاباتء وفهم polie‏ البيانات المختلفة التي تم جمعها حول الإصابات 

وتنظيف البيانات وتطوير تصويرات لجذب استدلالات مختلفة وبناء تحليلات إدارة 

الآداء لتحليل فترة التئام الجروح» وقواعد تسلسل الرسم؛ للتنبؤ بالعلاقات بين الإصابات 

ومختلف أجزاء الجسم المصابة بالإصابات. 
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Là Jis‏ مجموعة بيانات الإصابات من أكثر من 07٠‏ سجل إصابة في كرة القدم, 
والتي 3 تصنيفها في إطار المتغيرات الخاصة بالإصابة إلى: الجزء من الجسم/ موقع 
الجسم/ الشكل الجانبيء والإجراء Balls csl‏ نوع الإصابةء بداية الإصابة وتواريخ 
الشفاء والمتغيرات الخاصة باللاعب/ الرياضة إلى: بطاقة تعريف اللاعب» ومركز اللاعب 
في الملعب, والنشاط والبداية وموقع المباراة. وتم حسابُ وقت الشفاء من الإصابة لكل 
سجل؛ إذ تمّ تصنيفها إلى مجموعات مختلفة من الفترات الزمنية: ١-١‏ شهر. ۲-۱ شهرء 
1-٤ aal € Y‏ أشهرء و" أشهر- YE‏ شهرًا. 

3& إنشاءٌ تصويرات مختلفة؛ لاستنتاج معلومات من مجموعة بيانات الإصابات التي 
تصوّر فترة الشفاء المرتبطة بمراكز اللاعبين وشدة الإصابات وفترة الشفاء والعلاج PARU‏ 
والفترة الزمنية للشفاء المرتبطة بهاء والإصابات الكبيرة التي تصيبٌ أجزاء الجسم» وما إلى ذلك. 

وتم بناءٌ نماذج الشبكات العصبية لكل فئة من فئات الشفاء باستخدام 
IBM SPSS Modeler‏ وكان من المتغيرات المتوقعة: الحالة الراهنة للإصابةء الشدةء 
جزء الجسم» موقع الجسم» نوع الإصابةء النشاطء موقع الحدث, الإجراء المتخذ, والموقف. 
وكان نجاح تصنيف فئة الشفاء جيداً due‏ إذ كانت الدقة flog VAS‏ على التحليل تم 
اقتراح العديد من توصيات الأعمال؛ منها استخدامٌ المزيد من مُدخلات المختصين من بداية 
الإصابة بدلاً من السماح مموظفي غرفة التدريب بفحص اللاعبين المصابين. وتم تدريبُ 
اللاعبين في المراكز الدفاعية لتجنب الإصابة» وممارسة التدريب على آليات فحص السلامة. 

أسئلة للمناقشة: 

-١‏ ما هي أنواع التحليلات المطبّقة في تحليل الإصابات؟ 

-Y‏ كيف تساعد التصويراٹ في فهم البيانات وتقديم رؤى إلى البيانات؟ 

-Y‏ ما هي مشكلة التصنيف؟ 

£- ما الذي يمكن اشتقاقه عن طريق إجراء تحليل تتابعي؟ 

ما الذي يمكننا dolas‏ من هذه الحالة العملية؟ 

وبالنسبة GY‏ مشروع تحليلات؛ من المهمٌ Ulo‏ فهم نطاق JU. eSI‏ والحالة الراهنة 
dis‏ الأعمال من خلال تحليل مُوسّع للمورد الوحيد وهو البيانات التاريخية. وغالباً 
ما توفر عمليات التصوير ا مرئي أداةً dil;‏ لاكتساب الأفكار 2591 للبيانات» والتي يمكن 
تحسينها بشكل xS]‏ استنادًا إلى آراء الخبراء لتحذيد الأهمية الجوهرية لعناصر البيانات 
ذات الضّلة با مشكلة. كما تساعد ا معلومات المرئية في توليد أفكار لمشكلات غامضةء والتي 
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يمكن متابعتها في بناء رؤى إدارة «slot‏ والتى oS‏ أن تساعد المنظمات ge à‏ القرار. 
Source: Sharda, R., Asamoah, D., & Ponna, N. (2013). "Research and Pedagogy in‏ 
Business Analytics: Opportunities and Illustrative Examples." Journal of Computing‏ 
and Information Technology, 21(3), 171182-.‏ 


التحليلات التوجيهية: 


تُسمّى الفئة الثالثة من التحليلات بالتحليلات التوجيهية» والتي تهدف إلى التعرّف على ما يجري 
بالإضافة إلى التوقعات المحتملة واتخاذ القرارات؛ لتحقيق أفضل أداء ممكن. وقد تمت دراسة هذه 
ا مجموعة من الأساليب تاريخيًا تحت مظلة التقارير التشغيلية أو علوم IYI‏ وتهدف بشكل عام 
إلى تحسين أداء النظام. والهدف هنا هو تقديم قرار أو توصية بخصوص إجراء مُحدَّد. وقد تكون 
هذه التوصيات على شكل (نعم/ (Y‏ لاتخاذ قرار مرتبط aio JS a‏ لكل مشكلةء أو مبلغ معين 
(على سبيل JEM‏ سعر بند معين أو سعر الشحن)» أو مجموعة كاملة من خطط الإنتاج. وقد Ó‏ 
القرارات على صانع القرار في تقرير أو هكن استخدامها مباشرةٌ في نظام قواعد القرار الآلي LS)‏ هو 
الحال في أنظمة تسعير شركات الطيران). وبالتالي؛ هكن أيضاً تسمية هذه الأنواع من التحليلات 
بتحليلات القرار أو التحليلات المعيارية. eds‏ الحالة العملية 1,0 مثالاً على مثل هذه التطبيقات 


التحليلية المسبقةء وسوف نتعرف على بعض جوانب التحليل التوجيهي في الفصل السادس. 


حالة عملية 0-١‏ 
شركة ستيل بار (Steel Bar)‏ ا متخصصة تستخدم التحليلات لتحديد تواريخ تنفيذ 
التزاماتها وفقاً للموارد المتاحة 

هذه الحالة العملية مرتبطةٌ بنا جميعاً فقد كانت شركة ستيل بار (Steel Bar)‏ 
لا ترغب في الكشف عن اسمها (أو حتى مجال عملها الدقيق) تواجه مشكلة كبرى 
تتمثل في اتخاذ القرارات بشأن مخزون المواد الخام الذي تستخدمه لإرضاء العملاء؛ 
إذ تقوم هذه الشركة بتوفير قضبان حديدية iaai‏ لعملائها. وقد تقوم بتقطيع 
القضبان إلى أشكال أو أحجام مُحدَّدةء وقد تحتوي على مواد فريدة ومتطلبات تشطيب؛ 
إذ تقوم الشركة بشراء المواد الخام من جميع أنحاء العام وتخزينها في مستودعهاء 
وعندما يتصل jane‏ محتمل بالشركة لطلب عرض أسعار القضبان ا متخصصة وما يرتبط 
بذلك من بيانات (التكوين» أصل المعدنء الجودة. الأشكالء الأحجام... إلخ)» وعادةٌ ما 
يكون لدى مندوب المبيعات قليلٌ من الوقت لتقديم مثل هذا السعر ا في ذلك التاريخ 
الذي يمكن فيه تسليم المنتج وبطبيعة الحالء الأسعار. وما إلى ذلك. ومن ثم يجب اتخاذ 
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قرارات بشأن الوفاء بالالتزامات التاريخية, والتي تُحدّد في الوقت ا مناسب التواريخ التي 
يمكن أن x‏ تسليمٌ المنتجات التي طلبها العملاء. dhg‏ من مندوب المبيعات اتخاةٌ 
مثل هذه القرارات من خلال تحليل التقارير حول المخزون المتاح للمواد الخام. وقد 
تكون بعض المواد الخام المتوفرة قد التزم المندوب بالفعل بتسليمها؛ تلبيةٌ لطلب عميل 
آخر. وبالتالي؛ قد لا يكون المخزون الموجود في المخزن متاحاً بالفعل. ومن ناحية أخرى؛ 
قد تكون هناك مواد خام من المتوقع تسليمها في المستقبل القريب» ويمكن استخدامها 
أيضاً لتلبية طلب ed RS‏ من هذا العميل المحتمل. وأخيراً؛ قد تكون هناك فرصة أيضاً 
لتحصيل رسوم على uaz vallo‏ عن طريق إعادة تخصيص المخزون الذي تم الالتزامُ 
به مسبقا لتلبية هذا الطلب الجديد مع تأجيل الطلب الذي تم الالتزامُ به بالفعل. 
وبالطبع؛ فإنه يجب أن تستند هذه القرارات على تحليل التكلفة والعائد لتأخير طلب 
سابق. وبالتالي؛ يجب أن يتمكن النظام من سحب البيانات بشكلٍ لحظي من بيانات 
المخزون, والطلبات المجمّعة, والمواد الخام الواردة. وقيود الإنتاج وما إلى ذلك. 
ولدعم هذه القرارات الصادرة بناءً على الوعد وفقاً للمتاح؛ تمّ تطويرٌ نظام دعم 
القرار DSS‏ الفوري؛ من أجل تخصيصٍ أمثل للمخزون المتاح ولدعم تحليل ماذا - لو 
الإضافي. ويستخدم نظام دعم القرار مجموعةً من نماذج البرامج المختلطة والتي يتم 
lo‏ باستخدام البرامج التجارية. كما أدرجت الشركة نظام دعم القرار في نظام تخطيط 
موارد المؤسسة الخاصة بها لتسهيل استخدامها لتحليلات الأعمال. 
أسئلة للمناقشة: 
-١‏ لماذا A‏ إعادةٌ تخصيص المخزون من عميل إلى آخر؛ قضيةٌ رئيسةً للمناقشة؟ 
-Y‏ كيف هكن أن تساعد أنظمة دعم القرار في اتخاذ هذه القرارات؟ 
Source: Pajouh Foad, M., Xing, D., Hariharan, S., Zhou, Y., Balasundaram, B.,‏ 
Liu, T., & Sharda, R. (2013). "Available-to-Promise in Practice: An Application of‏ 
Analytics in the Specialty Steel Bar Products Industry." Interfaces, 43(6), 503517-.‏ 
http://dx.doi.org/10.1287/inte.2013.0693 (accessed July 2016).‏ 
التحليلاث المطبّقة على المجالات المختلفة: 
لقد أنتجت تطبيقاتٌ التحليلات في قطاعات الصناعة المختلفة العديد من المجالات ذات ALA‏ 
أو على الأقل التعبيرات الشائعة اليوم. ومن المألوف تقريباً أن نربط كلمة تحليلات (Sb‏ صناعة 
أو بيانات وبالإضافة إلى التصنيف العام لتحليلات adi‏ والتي تهدف إلى الحصول على قيمة من 
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النص (سيتم دراستها في الفصل الخامس». أو تحليلات الويب والتي تهدف إلى تحليل بيانات 
الويب؛ فقد تمّ تطويرٌ العديد من التحليلات المتعلقة مشكلة أو صناعة معينة. كما تمّ تطويرٌ 
التحليلات الخاصة بالعديد من المهن/ المجالات الخاصة بالصناعة أو المسائل الخاصة بالمشكلات. 
ومن أمثلة هذه المجالات تحليلاثُ التسويقء وتحليلات التجزئة» والنظريات الاحتياليةء وتحليلات 
Ji‏ والتحليلات الصحية: والتحليلات الرياضيةء وتحليلات المواهب. والتحليلات السّلوكية: وما 
إلى ذلك. فعلى سبيل المثال: قدَّم القسم ١-١‏ عبارة التحليلات الرياضية. ويمكن أيضاً تسمية 
الحالة العملية ١-١‏ دراسة حالة في تحليلات شركات الطيران» ez us‏ القسم التالي التحليلات 
الصحية وتحليلات السوق على نطاق واسع. وبمعنى دقيق يتم تصنيفٌ Gl‏ تحليل منهجي 
للبيانات في قطاع معين على أنه تحليلات Sal)»‏ الفراغات)». وعلى الرغم من أن هذا قد يؤدي 
إلى زيادة حجم مفهوم التحليلات؛ óp‏ الفائدة هي أن المزيدَ من الناس في صناعات مُحدّدة 
سيدركون قوة وقدرات التحليلات. كما يدفع إلى التركيز على اممتخصصين الذين يطوّرون ويطبّقون 
مفاهيم التحليلات في قطاع رأسي. deg‏ الرغم من أنَّ العديد من الأساليب لتطوير تطبيقات 
التحليلات قد تكون شائعة؛ B‏ هناك مشكلات فريدة في S‏ شريحة عمودية تؤثر على كيفية 
جمع البيانات» ومعالجتهاء وتحليلهاء وتنفيذ التطبيقات. وهكذا؛ [LS‏ التمييز بين التحليلات 
المستندة إلى التركيز العمودي؛ مفيدٌ Sa:‏ الإجمالي للانضباط. 
التحليلات أو علم البيانات: 

حتى في الوقت الذي يحظى فيه مفهومٌ التحليلات بمزيد من الاهتمام في دوائر الصناعة والأوساط 
الأكادهية؛ تمّ إدخالٌ مصطلح آخر وأصبح شائعاً وهو مصطلح علم البيانات» وا ممارسون لهذا العلم 
يُطلق عليهم «علماء بيانات»» وأحياناً يُنسَب إنشاء مصطلح ele‏ البيانات إلى (D. J. Patil) Jb‏ 
من LinkedIn‏ وكانت هناك بعض المحاولات لوصف الاختلافات بين Gc lad‏ البيانات وعلماء 
البيانات (على سبيل المثال انظر: emc.com/collateraliaboutinews/emc-data-science-‏ 
.(study-wp.pdf‏ ومن هذه الآراء i‏ محلل البيانات هو مجرد مصطلح آخر للمهنيين الذين كانوا 
يقومون بعمليات ذكاء الأعمال في شكل تجميع البيانات وتنظيفها وإعداد التقاريرء وأحياناً بعض 
التصويرء وتشمل مجموعات مهاراتهم» وشملت مجموعات مهاراتهم إكسل Excel‏ وبعض معارف 
SQL‏ وإعداد التقارير. ويمكنك التعرُف على هذه القدرات على أنها تحليلات وصفية أو تقارير. 
deg‏ النقيض من ذلك؛ Í‏ عام البيانات مسؤولٌ عن التحليل التنبؤي والتحليل الإحصائي» والأدوات 
التحليلية والخوارزميات الأكثر تقدماً. وقد يكون لديه معرفةٌ أعمق بالخوارزميات وقد تحت 
تصنيفات مختلفة كالتنقيب في البيانات» أو اكتشاف المعرفة أو elas‏ الآلة. وقد يحتاج بعض هؤلاء 
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الباحثين إلى معرفة برمجة أكثر عمقاً؛ ليكونوا قادرين على كتابة الكود لتنظيف/ تحليل البيانات 
في اللغات الحالية المعتمدة على الويبء Jis‏ لغة Java‏ أو Python‏ واللغات الإحصائية مثل R‏ 
كما يحتاج العديدُ من محترفي التحليلات إلى بناء خبرة كبيرة في النمذجة الإحصائية. والتجريب» 
والتحليل. ومرةً أخرى؛ ينبغي أن يدرك قراؤنا أن هذه المصطلحات تندرجُ تحت مظلة التحليلات 
التنبؤية والتوجيهية. ومع ذلك؛ تشتمل أيضاً التحليلات التوجيهية على خبرات أكثر أهميةٌ في تقارير 
التشغيل Le‏ في ذلك الأمثلية والمحاكاة وتحليل القرار وما إلى ذلك. ومن المرجّح أن يطلق على أولئك 
الذين يعملون على هذه الحقول علماء البيانات بدلاً من محترفي التحليلات. 

ol‏ وجهة نظرنا في التمييز بين التحليلات bleg‏ البيانات $455 في درجة المعرفة وا مهارات الفنية 
أكثر من الوظائف. ويبدو أنَّ goly‏ علوم الحاسوب والإحصاء والرياضيات التطبيقية ABS‏ تسمية 
علم البيانات» مع الاحتفاظ بتسمية التحليلات الخاصة بالمهنيين العاملين بشكل أكبر. وكمثال 
آخر على ذلك؛ اقترح المتخصصون في الفيزياء التطبيقية استخدام علم الشبكة كمصطلح لوصف 
التحليلات التي تتعلق بمجموعات من الناس؛ كالشبكات الاجتماعيةء وشبكات سلاسل التوريده 
وما إلى ذلك. انظر: http;/barabasi.com/networksciencebook/‏ للاطلاع على كتاب دراسي 
متطوّر حول هذا ا موضوع. 

وإذا صرفنا النظرٌ عن الاختلاف الواضح في مجموعة المهارات الذي يمتلكها مَنْ يقومون بإجراء 
تحليلات وصفية وإعداد التقارير فقط مقابل أولئك الذين ينخرطون في القيام بأنواع التحليلات 
الثلاثة؛ فإن التمييز بين مصطلح التحليلات وعلم البيانات يصبح غامضاً. ونلاحظ أن خريجي 
برامج التحليلات لدينا يكونون مسؤولين عن مهام تتوافق بش JS‏ أكبر مع مهام علماء البيانات» 
yug‏ مجرد فقط تقديم تقارير تحليلية. هذا الكتاب يهدف بوضوح إلى إدخال قدرات ووظائف 
جميع أنواع التحليلات» والتي تشمل علم البيانات وليس مجرد تقارير التحليلات» ومن الآن 
فصاعداً سنستخدمٌ التحليلات ees‏ البيانات بشكل متبادل. 
أسئلة مراجعة على القسم :0-١‏ 

-١‏ عرّف التحليلات. 

-Y‏ ما هي التحليلات الوصفية؟ وما هي الأدوات المتنوّعة المُستخدّمة في التحاليل الوصفية؟ 
-Y‏ كيف تختلف التحليلات الوصفية عن التقارير التقليدية؟ 

-E‏ ما هو مستودع البيانات؟ وكيف هكن لتقنية مستودعات البيانات المساعدة في تمكين التحليلات؟ 
0- ما هي التحليلات التنبؤية؟ كيف هكن للمنظمات استخدامٌ التحاليل التنبؤية؟ 
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1- ما هي التحليلات التوجيهية؟ ما هي أنواع المشكلات التي هكن llo‏ عن طريق التحليلات التوجيهية؟ 
-V‏ عرف النمذجة من منظور التحليلات. 

-A‏ هل من الجيد اتباع ala‏ الهرمي للتحليلات الوصفية والتنبؤية قبل تطبيق التحليلات التوجيهية؟ 
3- كيف هكن أن تساعد التحليلات في اتخاذ القرار الموضوعي؟ 


1-١‏ أمثلة على التحليلات فى مجالات مختارة: 


في الفصول المتنوّعة لهذا الكتاب سنتطرّق للعديد من أمثلة تطبيقات التحليلات» وهذا هو 
أحد الطرق الرئيسة المُستخدّمة في هذا الكتاب (التعرض - (Exposure‏ في هذا القسم سنلقي 
الضوء على مجالين من المجالات المهمة لتطبيق التحليلات والتي حققت نجاحاً ملحوظاً؛ وهما: 
الرعاية الصحية وبيع التجزئة. 
تطبيقات التحليلات في الرعاية الصحية - أمثلة :Humana‏ 

على الرغم من أنَّ تحليلات الرعاية الصحية تُطّي مجموعة ulg‏ من التطبيقات من الوقاية 
إلى التشخيص إلى العمليات WEA‏ ومَنْع الاحتيال؛ فإننا نرگز على بعض التطبيقات التي 3& 
Lasst‏ في شركة تأمين صحي رئيسة» ووفقاً U‏ ذكره موقع الشركة على الإنترنت: «تتكامل 
إستراتيجية الشركة لتقديم الرعايةء وتجربة الأعضاء والرؤى الإكلينيكية ورؤى المستهلك؛ بهدف 
تشجيع المشاركة» وتغيير «doll‏ والتواصل الإكلينيكي الاستباقي والتعافي». وينطوي تحقيقٌ هذه 
الأهداف الإستراتيجية على استثمارات كبيرة في تقنية ا لمعلومات بشكل ele‏ والتحليلات بشكلٍ 
خاص. Brian LeClaire ó!‏ هو نائب الرئيس ورئيس قسم المعلومات في Humana‏ وهي شركة 
تأمين رئيسة في الولايات المتحدة. وحاصلٌ على الدكتوراه في MIS‏ من جامعة أوكلاهوما. وقد 
دافع عن التحليلات PIS‏ تنافسي في Humana‏ كما شارك في إنشاء مركز للتميّز في التحليلات. 
ووصف المشاريع التالية بأنها أمثلة على مبادرات Humana‏ في نطاق التحليلات التي يقودها 
Vipin Gopal‏ رئيس التحليلات الإكلينيكية في -Humana‏ 
مثال١: gis‏ حوادث سقوط JUS‏ السن - مدخل تحليلي: 

is‏ الإصابة نتيجةٌ للس قوط خطراً صحيًا كبيراً لكبار السن الذين يبلغون من العمر ٠٥‏ عام 
فهم أكثر من ثلث من يصابون في حوادث سقوط ele JS‏ إن حوادث الس قوط هي أيضاً 
العامل الرئيس dS)‏ من الإصابات القاتلة وغير المميتة بالنسبة لكبار السن؛ إذ يؤدي ذلك إلى 
زيادة خطر الإعاقة بنسبة تصل إلى 0١‏ 
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JS is‏ تكاليفٌ هذه الإصابات lue‏ كبيراً على نظام الرعاية الصحية بالولايات المتحدة 
الأمريكية؛ إذ بلغت التكاليف المباشرة للسقوط بنحو FE‏ مليار دولار في عام ۴٠١۲م‏ وحده. ومع 
ارتفاع النسبة المئوية لكبار السن في الولايات المتحدة؛ فمن المتوقع أن تتزايد حوادث السقوط 
والتكاليف المرتبطة بها. ووفقاً لمراكز التحكم في الأمراض والوقاية منها Ol (CDO)‏ «حوادث 
السقوط هي مشكلةٌ صحيةٌ dale‏ يمكن منعها إلى A‏ كبير»”. 

Humana idis‏ ثاني أكبر مورد لبرنامج Medicare Advantage‏ الذي dea‏ حوالي ۳۲ مليون 
gås‏ معظمهم من JLS‏ السن. ÓL‏ الحفاظ على أعضائها البارزين ومساعدتهم في العيش بأمان 
في منازلهم؛ هو aas‏ تجاري رئيس؛ إذ 333 Ra‏ حوادث السقوط مكسباً مهماً. ومع ذلك؛ لم 
تكن هناك منهجيةٌ Aolo‏ لتحديد الأفراد الأكثر عرضةً للسقوط والذين A‏ جهود الوقاية مفيدةٌ 
لهم. وعلى عكس الحالات الطبية المزمنة مثل السكري والسرطان؛ IB‏ السقوط ليس Ab dli‏ 
واضحة المعاط. وبالإضافة إلى ذلك؛ لا يتم الإبلاغ عن حالات الس قوط ole‏ في بيانات المطالبات؛ 
نظراً لأن الأطباء يميلون في الغالب إلى ترميز نتائج السقوطء مثل: الكسور والاضطرابات. deg‏ 
الرغم من وجود العديد من التقييمات التي تتم إدارتها إكلينيكيًا لتحديد وجود اللتعثرين؛ فإنها لا 
تصل إلا لعدد محدود من الحالات وتفتقر إلى طاقة فعلية كافية. وعلى هذا النحو؛ فهناك حاجة 
إلى طريقة مس تقبلية دقيقة لتحديد الأفراد الأكثر at.‏ لخطر السقوط؛ حتى يتمكنوا من اتخاذ 
إجراءات استباقية gib‏ السقوط. وقد أجرى التحليل الإحصائي لشركة Humana‏ عملية تطوير 
نموذج تنبؤي بحوادث السقوط. hiag‏ هو أول تقرير رسمي شامل يستفيدٌ من المطالبات الطبية 
والصيدلية الإدارية والبيانات الإكلينيكيةء والأنماط الإكلينيكية المؤقتة» ومعلومات المستهلك» 
وغيرها من البيانات لتعريف الأفراد المعرّضين لخطر السقوط في نطاق زمني مُحدّد. 

à si‏ طريقة بي el‏ فالز (PM Falls)‏ حالياً عنصراً أساسياً لقدرة شركة هيومانا (Humana)‏ على 
تحديد كبار السن الذين بإمكانهم الاستفادة من التدخلات للتخفيف من سقوطهم. تحديد كبار 
السّن الذين يمكنهم الاستفادة من تدخلات التخفيف من السقوط. وقد أظهر برهان isla‏ للمفهوم 
مع مستهلي Humana‏ الذين يمثلون ال XY‏ الأعلى ضمن مخاطر السقوط؛ Sae GÍ‏ المستفيدين من 
خدمات العلاج الطبيعي قد qii]‏ مشيراً إلى أن المستهلكين يتخذون خطواتٍ فعالةٌ لتقليل مخاطر 
السقوط. وهناك مبادرةٌ ثانيةٌ تستخدم طريقة PM Falls‏ لتحديد الأفراد المعرّضين للخطر حتى 
يخضعوا لبرامج اللراقبة عن بُعد. وباستخدام Humana cs PM‏ من تحديد ۲۰,۰۰۰ مستهلك 
تعرّضوا لخطر السقوطء وهم الذين استفادوا من هذا البرنامج. ويرتدي المستهلكون الذين تم 
تحديدهم جهازاً يكتشف السقوط وينبّه المستهلك طُوال posl‏ وعلى مدار الأسبوع للمساعدة الفورية. 
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وحصل هذا العمل على جائزة Analytics Leadership‏ من قبل كلية Kelly‏ لإدارة الأعمال 
بجامعة Indiana‏ في عام 10« وذلك لتبئّيه أساليب التحليل في بيئة العمل. 


مثال؟: هدف هيومانا الجريء - تطبيق التحليلات لتحديد المقاييس المناسبة: 


في عام eY- yE‏ أعلنت شركة Humana‏ عن هدف المنظمة الجريء لتحسين ouo‏ المجتمعات 
امحلية بنسبة ×۲١‏ بحلول عام ١٠٠۲م‏ من خلال تسهيل الأمر لتحقيق أقصى درجات الصحة. ويمكن 
تعريف المجتمعات التي تخدمها Humana‏ بطرق عديدة, جغرافياً (الولاية» ا مدينةء الحي)» وحسب 
المنتج (برنامج Medicare Advantage‏ الخطط القائمة على صاحب «asl‏ الخدمات المشتراة بشكل 
فردي)» أو عن طريق الملف الإكلينيي (شروط الأولوية Le‏ في ذلك مرض السكريء ارتفاع ضغط el‏ 
CHF‏ [فشل القلب الاحتقاني]ء CAD‏ [مرض الشريان التاجي]» COPD‏ (مرض الانسداد الرئوي 
المزمن) أو ”الاكتئاب“. Ol‏ فهم صحة هذه المجتمعات وكيفية تتبّعها بمرور الوقت؛ Sol‏ بالغ الأهمية 
ليس فقط لتقييم الهدف؛ ولكن أيضاً في صياغة إستراتيجيات لتحسين الصحة العضوية في مجملها. 
وكان gial‏ أمام منظمة التحليلات يتمثل في تحديد مقياس يرز جوهر الهدف الجريء؛ لأن 
مقاييس التأمين الصحي التقليدية المقاسة موضوعيًاء مثل القبول في المستشفيات أو زيارات غرف 
الطوارئ ٠٠٠١ USO‏ شخص لن تنهض هذه المهمة الجديدة. وكان الهدف هو ados‏ المقياس 
الذي يحافظ عليها ويُحسّنها في المجتمع؛ ولكن يجب أن يكون مرتبطاً بأعمال شركة هيومانا 
(Humana)‏ ومن خلال تقييمات تحليلية صارمة؛ اختارت Humana‏ في نهاية المطاف ”الأيام 
الصحية“؛ وهو عبارة عن استبيان من أربعة أسئلةء عن جودة الحياة وقد تمّ تطويره من قبل 
مركز التحكم في الأمراض لتتبع وقياس تقدُّمهم نحو تحقيق الهدف الجريء. 
كان من الضروري التأكّد من أن المقياس المُحدّد يرتبط ارتباطاً كبيراً مقاييس الصحة والأعمال؛ 
بحيث يؤدي ial‏ تحسّن في الأيام الصحية إلى تحسين الصحة» وإلى نتائج أعمال «al‏ وتتضمّن 
الأمثلة التالية كيفية ارتباط ”الأيام الصحية“ بمقاييس الاهتمام: 
- يظهر الأفراد الذين لديهم أيام غير صحية أكثر استخداماً وأنماط تكلفة عالية. JS‏ 0 أيام غير 
صحية إضافية هناك: 
(T)‏ زيادة قدرها AY‏ دولاراً في متوسط التكاليف الطبية والصيدلية الشهرية. 
(ب) زيادة قدرها OY‏ دخولاً للمستشفيات لکل ٠٠٠١‏ مريض. 
C)‏ زيادة ٠,۲۸‏ يوماً في متوسط مدة البقاء. 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dole‏ على ذكاء الأعمال والتحليلات وعلم البيانات 


- الأفراد الذين يُظهرون س لوكيات سليمة وظروفهم المزمنة تدار بشكل جيد لديهم عدد أيام غير صحية 
Ji‏ على سبيل المثال: الأفراد المصابون بمرض السكري لديهم Sae‏ أيام غير صحية أقل إذا حصلوا على 
فحص الدهون السيئة أو فحص العين السُكرية iilos‏ إذا كان هناك تحكم في مستويات السكر في الدم. 

- الأفراد الذين يعانون من الأمراض المزمنة لديهم عدد phi‏ غير صحية أكثر Qa‏ ليس لديهم 
حالات مزمنة ومنها: مرض السكريء ارتفاع ضغط CHE «Jl‏ [فشل القلب الاحتقاني]» CAD‏ 
[مرض الشريان التاجي]ء COPD‏ (مرض الانسداد الرئوي المزمن) ”أو الاكتئاب“. 

ومنذ ذلك الحينء اعتمدت Humana‏ الأيام الصحية كمقياس لها لقياس التقدِّم نحو تحقيق 
هدفها الجريء. 
iUis‏ نماذج تنبؤية لتحديد أعلى نسبة من المخاطر في شركة تأمين صحي: 

تنطبق قاعدة ۸٠/۲١‏ بشكل عام على الرعاية الصحيةء وتعني أنَّ حوالي XY‏ من ال مرضى 
يستهلكون ۸٠0‏ من موارد الرعاية الصحية؛ بسبب حالتهم الصحية ال متدهورة أو المزمنة. 

& حاسم في التسجيل في الرعاية الصحيةء وفي السنوات الأخيرة‎ Sol تحديد الأعضاء المناسبين‎ ol 
تطويرٌ أنظمة لإدارة الأداء تقوم بتحديد المُسجُلِين الأعلى مخاطر في ا مستقبل. كما تمّ تطويرُ العديد‎ 
من أنظمة إدارة الأداء هذه مع الاعتماد الكبير على بيانات المطالبات الطبية والتي تنتج عن الخدمات‎ 
الطبية التي يستخدمها المسجلون. بسبب التأخر الموجود في تقديم بيانات المطالبات ومعالجتهاء‎ 
عالية للتسجيل في البرامج السريريةء وهذه‎ blab هناك تأخر مماثل في تحديد الأعضاء ا معرضين‎ 
ليس لديهم تاريخ‎ OS إلى شركة تأمين صحي‎ oih أعضاء‎ cày عندما‎ fols المسألة ذات أهمية‎ 
مطالبات صحي مع شركات تأمين أخرى. يمكن أن يستغرق مُقدَّم الطلب الذي يعتمدُ على المطالبات‎ 
لتحديدهم للإحالة إلى البرامج الإكلينيكية.‎ åh شهراً بعد تسجيل أعضاء‎ Y-A في المتوسط‎ 

في أوائل العقد الجاري جذبت شركة هيومانا Lal‏ من الأعضاء SX AUI‏ من خلال منتجات 
ميدكير إدفانتج (Medicare Advantage)‏ وبالتالي احتاجت إلى طرق أفضل لإدارة الأعضاء. وعلى 
هذا النحو؛ أصبح من Gall‏ للغاية تطوير نهج تحليلي آخر لتحديد الأعضاء الجدد ذوي المخاطر 
العالية بشكلٍ سريع ودقيق للإدارة الإكلينيكيةء للحفاظ على صحة هذه المجموعة وخفض التكاليف. 

وقد قام فريق التحليلات الإكلينيكية التابع ل pohu Humana‏ نموذج التنبؤ بالأعضاء 
الجدد (NMPM)‏ والذي Soo‏ بسرعة الأفراد المعرّضين للخطرء وسيغيّر قريباً تسجيلهم الجديد 
للبرنامج مع Humana‏ بدلاً من الانتظار حتى يصبح تاريخ اممطالبة الكافي متاحاً لتجميع الملفات 
الإكلينيكية والتنبؤ بمخاطر الصحة المستقبلية. وقد تمّ تصميمٌ نموذج التنبؤ بالأعضاء الجُدُد 
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لمواجهة cole]‏ الفريدة المرتبطة بالأعضاء OA‏ وهو أسلوبٌ حديدٌ استفاد من مجموعات 
البيانات الأوسع نطاقاً ودمجها بخلاف بيانات المطالبات الطبيةء مثل بيانات تقييم المخاطر الصحية 
التي تم ELY‏ عنها ذاتياً والمؤشرات المبكرة من بيانات الصيدلةء واستخدام أساليب التنقيب في 
البيانات المتقدّمة لاكتشاف النمطء وسجل المستهلك يوميًا في Medicare Advantage‏ استنادًا 
إلى أحدث بيانات Humana‏ حتى الآن. وقد تمّ نشرٌ النموذج من خلال فريق مُتعدّد الوظائف 
من التحليلات وتقنية المعلومات والعمليات؛ لضمان تكامل التشغيل وتكامل الأعمال بسلاسة. 

ومنذ أن تمّ تطبيقٌ نموذج jal‏ بالأعضاء الجدد في ینایر YAY‏ فقد استطاعوا بشكلٍ سريع تحديد 
الأعضاء ذوي المخاطر العالية من أجل تسجيلهم في برامج تعليمية إكلينيكية. وقد تمّ إبراز النتائج 
الإيجابية التي تحققت من خلال هذا النموذج في العديد من اتصالات القيادات العليا من -Humana‏ 
وفي الربع الأول من عام ۴ أعلن Bruce Broussard‏ الرئيس التنفيذي لشركة Humana‏ عن 
”الزيادة التي طرأت على الأعضاء الجدد والتحسن في عمليات التقيي م الإكلينيكي"» والتي esl‏ إلى 
تسجيل ٠٠٠١‏ عضو جديد في البرامج الإكلينيكية: مقارنة ب 60٠١‏ عضو في نفس البرنامج عن فترة 
سابقة من العام بزيادة قدرها VO‏ 20 بالإضافة إلى زيادة حجم التسجيل في البرنامج الإكلينيكي؛ 
أظهرت دراسات النتائج أن المستهلكين IA‏ المسجّلين الذين حَذَّدهم نموذج التنبؤ بالأعضاء الجدد 
قد تمّ تحويلهم إلى البرامج الإكلينيكية في وقتٍ أقرب» مع أكثر من 0٠‏ من الحالات ا محؤلة التي تم 
تحديدها خلال الأشهر الثلاثة الأولى بعد التسجيل الجديد في «Medicare Advantage‏ وقد شارك 
المستهلكون الذين تمّ تحديدهم laf‏ معدل أعلى واستمروا لفترة أطول في البرامج. 

توضّح هذه الأمثلة كيفية قيام المنظمة باستكشاف تطبيقات التحليل وتطبيقها لتحقيق أهدافها الإستراتيجية. 
وسنعرض في الفصول القادمة من هذا الكتاب العديد من الأمثلة الأخرى لتطبيقات الرعاية الصحية. 





تحليلات سلسلة قيمة البيع بالتجزئة: 

Jia قطاع البيع بالتجزئة؛ هو المكان الذي قد ترى فيه معظم تطبيقات التحليلات» وهو‎ i 
وفيه تتغير أذواق العملاء وتفضيلاتهم‎ ilt ولكن هوامش الربح عادةً تكون‎ oe تكون فيه القيم‎ 
من التحَذَّيات في سبيل‎ Ía مما يجعل المتاجر - المباشرة أو عبر الإنترنت - تواجه‎ t/a بشكلٍ‎ 
الكثير‎ pis مستمرً؛ لذا فإنَّ الاستثمار في‎ Bled لا تضمن‎ sols s النجاح. وهيمنة السوق في‎ 
المساهمين الذين يدفعون سلس لة قيمة بيع التجزئة إلى‎ 5s عن المورّدين والعملاء والموظفين‎ 
النجاح واستخدام تلك العلومات لاتخاذ قراراتِ أفضل كان هدفاً لصناعة التحليلات لفترة طويلة.‎ 
الهائلة في التحليلات لتقوية سلسلة‎ Amazon وحتى قراء التحليلات العارضين يعرفون استثمارات‎ 
وغيرهما من كبار تجار التجزئة‎ Targets Walmart من‎ QS القيمة التابعة لهم. وبالمثل؛ استثمرت‎ 
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ملايين الدولارات في التحليلات الخاصة بسلاسل التوريد الخاصة بهم. ويتمتع معظم مورّدي 
تقنية وخدمة E‏ 
التطبيقات لتحقيق هدف التعرّض الذي نحن بصدد دراسته هكن أن تملأ كتابًا كاملًا. لذلك Jl‏ 
هذا القسم الضوء فقط على بعض التطبيقات المحتملة. وقد تمّ إجراء معظم هذه العمليات 
بواسطة العديد من تجار التجزئة Q9‏ توفيرها من خلال العديد من مُورّدي التقنية؛ ولذلك 
ففي هذا القسم سوف AD‏ نظرةً أكثر عموميةً بدلا من الإشارة إلى حالات مُحدّدة. وتم £L‏ 
هذه النظرة العامة من قبل pabl Abhishek Rathi‏ التنفيذي ل YCreaTek.com‏ وهي شركة 
لخدمات البرمجيات التحليلية ولديها مكاتبُ في الهند والولايات المتحدة والإمارات العربية المتحدة 
وبلجيكا؛ إذ تة تقوم الشركة بتطوير تطبيقات في مجالات متعددة. وخصوصًا تحليلات بيع التجزئة. 

ويعرض الشكل (Y-Y)‏ المكونات المختارة لسلسلة قيمة بيع التجزئة. يبدأ الشكل بالمورّدين 
ويختتم بالعملاء؛ ولكنه يوضح العديدٌ من نقاط قرار التخطيط الإستراتيجي والتشغيلي المتوسط؛ 
إذ هكن أن ads‏ التحليلات - الوصفية أو التنبؤية أو التوجيهية - دورًا في اتخاذ قراراتٍ أفضل 
تعتمد على البيانات. كما يوضح الجدول )1-1( أيضاً بعض اللجالات المهمة لتطبيقات التحليلات» 
وأمثلة على الأسئلة الرئيسة التي يمكن أن تجيب عنها التحليلات» وبكلٌ تأكيد. قيمة الأعمال 
ا محتملة المشتقة من إجراء مثل هذه التحليلات. ثم يتم مناقشة بعض الأمثلة فيما بعد. 





سلسلة قيمة بيع التجزدة 
الإحتياجات الحرجة فى كل نقطة إتصال على سلسلة قيمة بيع التجزئة 





اللمبيعات 
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أبناء البقاء ورضا العميل OT‏ إدارة سلاسل التوريد 
العملات الترويجية المستهدفة 
شا (pep‏ م تسن ىز 
5 أتنفيذ الطلييات و المنقدياك! تحسين العملات الترويجية 
خدمة عملاء LTV‏ تكاليف تقل مخفضة . والسعر 









































شكل ١-؟1:‏ مثال لتطبيقات التحليلات في سلسلة قيمة بيع التجزئة 
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جدول :١1-١‏ أمثلة لتطبيقات التحليلات في سلسلة قيمة بيع التجزئة 
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تطبيق سؤال الأعمال قيمة الأعمال 
التحليل 
- أي المنتجات عليها Cb‏ أعلى؟ -١‏ توقع استهلاك المنتجات سريعة الحركة, 
-Y‏ ما هي المنتجات بطيئة [iSl‏ وطلب مخزون كاف منها؛ vie‏ 
تحسين أو المتقادمة؟ سيناريو نفاذ EMT‏ 
المخزون -Y‏ رفع معدل دوران المخزون للمنتجات 
بطيئة الحركة؛ من خلال الجمع بينها في 
طلب gii‏ 
-١‏ ما مقدار صافي هامش الربح؟ -١‏ تخفيض السعر لكل منتج يمكن أن يقلل 
مرونة -Y|‏ ما مقدار الخصم الممكن منحه على | خسارة هامش الدولار. 
السعر | النتج؟ ez -Y‏ تحديدٌ السعر الأمثل لحزمة المنتجات 
لتوفير هامش الدولار 
-١‏ ماهي المنتجات التي يجب دمجها | aa -١‏ تحليلُ التقارب الارتباطات الخفية 
لإنشاء عرض حزمة؟ بين المنتجاتء والتي يمكن أن تساعد في 
-Y‏ هل يجبُ الجمع بين المنتجات io‏ القيم التالية: 
js‏ على خصائص الحركة البطيئة والسريعة | ٠‏ وضع إستاتيجية لحزمة انتج 
2l.‏ الحركة؟ ١‏ إستنادًا إلى التركيز على المخزون أو 
. |"- هل يجب إنشاء daja‏ من نفس الفئة أو الهامش. 
EE‏ خط فئة مختلف؟ « زيادة عمليات cross-sell‏ عن 
طريق إنشاء حزمة من فئات 
مختلفة أو زيادة عمليات up-sell‏ 
من نفس الفئات. 
T‏ مَنْ من العملاء يشتري gi‏ المنتجات في أي | عن طريق تقسيم العملاء؛ يمكن مالك 
^ أمكان؟ الأعمال إنشاء خروض Aes iai‏ 0 
Bee‏ تجربة Mad!‏ وتؤدي إلى الاحتفاظ بهم. 
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pu‏ سؤال الأعمال قيمة الأعمال 
-١‏ مَنْ هم العملاء الذين لن يعودوا؟ -١‏ يمكن تحديد العلاقات بين العملاء 
-Y‏ ما مقدار الخسارة في الأعمال؟ وا منتجات التي تؤدي لتحؤل العملاء. 
تحليل -P|‏ كيف هكن الاحتفاظ بهم؟ وبالتالي يمكن أن يتم SS‏ بشكل 
$ed‏ |6- ما التركيبة السكانية للعميل صاحب أفضل على جودة المنتج والسبب وراء 
العميل إلى أ الولاء؟ هذا التحول. 
امنافسين -Y‏ بالاعتماد على قيمة حياة العميل 
(LTV)‏ هكن ELEI‏ بالتسويق اموجه؛ 
مما يؤدي إلى الاحتفاظ بالعميل. 
-١‏ ما هي قناة اكتساب العملاء ذات | يمكن تحسينُ ميزانية التسويق lo‏ على 
تحليل التكلفة الأقل؟ رؤية العائد الأفضل على الاستثمار. 
القنوات -Y||‏ ما هي BUS‏ الاحتفاظ الأفضل بالعملاء؟ 
-Y‏ ما هي القناة الأكثر ربحية؟ 
-١‏ ما هو الموقع الواجب اختياره؟ -١‏ يمكن استخدامٌ أفضل الممارسات للمواقع 
تحليل |- ما هو المخزون الافتتاحي الواجب اقتناؤه ١‏ والقنوات الأخرى للبدء في القفز. 
الفروع وما مقداره؟ -Y‏ يمكن أن تساعد المقارنة ببيانات المنافس 
الجديدة في إنشاء عامل تمييز/ USP‏ لجذب 
العملاء الجدد. 
-١‏ كيف يجب تخطيط المتجر؛ من أجل | -١‏ فهم ارتباط المنتجات لاتخاذ قرارٍ يشأن 
الخطوط العليا الأفضل؟ تصميم المتجر وتوافقه بشكل أفضل مع 
تصميم -Y|‏ كيف هكن زيادة تجربة العملاء داخل | احتياجات العملاء. 1 
المتجر المتجر؟ -Y‏ يمكن تخطيطٌ نشر القوى العاملة لتفاعل 


العملاء بشكل أفضل وبالتالي إرضاء 
تجربة العملاء. 














vo 
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سؤال الأعمال قيمة الأعمال 
التحليل 





-١‏ ما التركيبة als 2l‏ التي تدخل المتجر | -١‏ يمكن تخطيطٌ العروض الترويجية 
خلال فترة ذروة المبيعات؟ والأحداث داخل المتجر بناءً على التركيبة 

تحليلات -Y|‏ كيف يمكن تحديدٌُ العميل صاحب | السكانية للزيارات الواردة. 

الفيديو | أعلى (LTV)‏ عند مدخل المتجر؛ بحيث | -Y‏ مشاركة العميل Bigi ll‏ والخصم 

يمكن توفير تجربة شخصية أفضل لهذا | الفوري sd‏ تجربة العميل؛ مما يؤدي 

العميل؟ إلى زيادة الاحتفاظ به. 




















Gale‏ ما يعرف موقع بيع التجزئة عبر الإنترنت عملاءه بمجرد تسجيل دخول العميلء وبالتالي 
يمكنهم تقديم صفحات/ عروض مُخصّصة لتحسين التجربة. وبالنسبة Sy‏ متجر لبيع التجزئة؛ 
فَإنَّ معرفة alas‏ عند مدخل المتجر لا يزال Jig‏ تحديّا Mus‏ ومن خلال الجمع بين تحليلات 
الفيديو والمعلومات/ الشّارات الصادرة من خلال برنامج الولاء قد يتمكّن المتجرٌ من تحديد 
العميل عند المدخل نفسه. وبالتالي تمكين فرصة إضافية لعمليات cross-sell‏ أو Meg .up-sell‏ 
على ذلك؛ هكن توفير تجربة تسوق شخصية بمشاركة أكثر تخصيصاً خلال وقت العميل في المتجر. 

ويستثمر تجار التجزئة SI‏ من امال في نوافذ عرض جذدَّابة أو فعاليات ترويجية أو 
رسومات مُخصّصة أو تزيين المتجر أو إعلانات مطبوعة أو لافتات. ولتعزيز فعالية هذه الأساليب 
التسويقية؛ يمكن للفريق استخدامٌ تحليلات المتسوقين من خلال مراقبة صور الدوائر التلفزيونية 
المغلقة (CCTV)‏ ممعرفة التفاصيل الدهوغرافية لحركة القدم داخل ا متجر» ويمكن تحليلٌ aso‏ 
CCTV‏ باستخدام خوارزميات مُتقدّمة لاستخراج تفاصيل دموغرافية» مثل: السّن والجنس» 
ومزاج الشخص الذي يتجول بالمتجر. 

إضافةً إلى ذلك؛ OSE‏ لبيانات حركة العميل داخل المنجر عند دمجها مع تصميم الرفوف أن تعطي 
نظرةً pab A86‏ ا متجر لتحديد مناطق البيع الس اخنة/ المربحة داخل المتجر. وعلاوةً على ذلك؛ يمكن 
مدير المتجر استخدامٌ هذه المعلومات لتخطيط توزيع القوة العاملة لهذه ا مناطق في أثناء فترات الذروة. 

وعادةً ما يتم استخدامٌ تحليل سلة السوق من قبل مديري الأقسام لدفع بيع SKUS‏ بطيئة 
الحركة. وباستخدام التحليلات المتقدّمة من البيانات المتاحة؛ هكن أن يكون تقاربٌ المنتج في 
dol‏ مستوى من SKU‏ لدفع عائدات الاستثمار على عروض الحزمة لأعلى. وبالإضافة إلى ذلك؛ 
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فباستخدام أساليب مرونة السعر؛ هكن أيضاً تخفيض السعر لعرض الباقة؛ مما يقلل أيّ خسارة 
في هامش الربح. 

وهكذاء وباستخدام بيانات التحليلات» لا يمكن لتجار التجزثة الحصول على معلومات عن 
عملياتهم الحالية فحسب؛ بل هكن أيضاً الحصولٌ على مزيد من الإحصاءات لزيادة الإيرادات 
وخفض التكلفة التشغيلية لربح أعلى. ويقترح مدوّن في علوم البيانات المركزية Data Science)‏ 
loli Al (Central‏ إلى 45 ما لتطبيقات تحليلات التجزئة الحالية وا محتملة والتي يمكن ملتاجر 
التجزئة الكيرى مثل Amazon‏ استخدامها. وهذه القائمة متاحةٌ على: 
http://www.datasciencecentral.com/profiles/blogs/20-data-science-systems-used-by-‏ 

ainazon-to-operate-its-business. 


وكما ذكرنا سابقاً؛ o‏ هناك Lai‏ من الأمثلة على هذه الفرص امُدرّجة هنا؛ ولكنك سترى 
العديد من الأمثلة على مثل هذه التطبيقات في جميع أنحاء الكتاب. 


أسئلة مراجعة على القسم :5-١‏ 

ISU -١‏ تستثمرٌ شركة التأمين الصحي في التحليلات عقب اكتشاف الاحتيال؟ ولماذا من مصلحتهم 
التنبؤ باحتمالية سقوط المرضى؟ 

-Y‏ ما هي التطبيقات الأخرى المشابهة للتنبؤ بالسقوط التي يمكنك تصورها؟ 

S(Humana Y كيف تقنع عميل تأمين صحي جديداً بتبَنّي أماط حياة صحية (مثال‎ -Y 

-E‏ خَدَّد على الأقل ثلاث فرص أخرى لتطبيق التحليلات في سلسلة قيمة البيع بالتجزئة بخلاف 
تلك التي R3‏ تغطيتها في هذا القسم. 

0- ماهي متاجرٌ بيع التجزئة التي تعرفها التي تستخدمٌ بعض تطبيقات التحليلات» التي 
تمّ تحديدها في هذا القسم؟ 

donio ۷-1‏ موجزة لتحليلات البيانات الضخمة: 


ما هي البياناث الضخمة؟ 
il‏ كتاب عن التحليلات وعلم البيانات؛ يجبُ أن يشمل dass‏ كبيرةَ لما يُسمّى بتحليلات 
البيانات الضخمة. وسنقوم بتغطيتها في الفصل السابع؛ ولكننا هنا نعرض auio‏ موجزةً للغاية 
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عن بداية ظهورها. ÓI‏ عقولنا تعمل بسرعة وفعالية عالية ومتنوعة في معالجة كمياتٍ كبيرة من 
جميع أنواع البيانات: الصورء والنصوص, والأصواتء والروائح» ومقاطع الفيديو. حيث تقوم 
بمعالجة جميع أشكل البيانات المختلفة بسهولة نسبية. غير أنَّ أجهزة الحاسوب لا تزال Jes‏ 
صعوبة في مواكبة وتيرة إنشاء البيانات» فضلاً عن تحليلها åse pas‏ وهذا هو السبب في أن لدينا 
مشكلة البيانات الضخمة. do]‏ ما البياناثٌ الضخمة؟ ببساطة البيانات الضخمة؛ هي البيانات التي 
لا هكن تخزينها في وحدة تخزين واحدة. وتشير البيانات الضخمة ole‏ إلى البيانات التي db‏ في 
العديد من الأشكال المختلفة: مهيكلةً وغير مهيكلةء في تيار وما إلى ذلك. إن المصادر الرئيسة 
ممثل هذه البيانات هي مقتطفات من مواقع الويبء والمنشورات بمواقع التواصل الاجتماعي مثل 
Facebook‏ وبيانات من الزيارات أو من أجهزة الاستشعار أو الطقس. ويحتاج أي محرك بحث 
على الويب» مثل Google‏ إلى بحث وفهرسة المليارات من صفحات الويب لمنحك نتائج بحث 
ملائمة في se‏ من الثانية. وعلى الرغم من أن هذا لا يتم بشكلٍ لحظي؛ ÓB‏ إنشاء فهرس لجميع 
صفحات الويب على الإنترنت ليس مهمة سهلة. ولحُسْن الحظ؛ فقد تمكّتت شركة «Google‏ من 
حل هذه المشكلة. فمن بين الأدوات الأخرى» استخدمت أساليب تحليل البيانات الضخمة. 

وهناك جانبان لإدارة البيانات بهذا الحجم وهما: التخزين والمعالجة. فإذا استطعنا شراء 
حل تخزين ajs‏ للغاية لتخزين JS‏ هذا في مکانِ واحد على وحدة واحدة؛ óp‏ جعل هذه 
الوحدة تسمح بالخطأ قد يكون مكلفاً للغاية. ومن ثم فقد تمّ اقتراح jais gies Jor‏ على 
تخزين هذه البيانات في أجزاء مختلفة من أجهزة متصلة بشبكة. ووضع نسخة أو اثنتين من 
هذه البيانات في مواقع مختلفة على الشبكةء من الناحيتين المنطقية والمادية. وتمّ استخدامه في 
الأصل في Google‏ (والذي كان يُسمّى آنذاك بنظام ملفات (Google‏ وتم تطویره وإصداره لاحقاً 
كمشروع Apache‏ باسم نظام الملفات المقسمة من „(Hadoop HDFS)‏ 

ومع ذلك؛ فإن تخزين هذه البيانات Jte‏ نصف المشكلة فقط. فالبيانات لا قيمة لها إذا كانت 
لا Éad páis‏ للأعمالء ولكي توفر Fas‏ للأعمال؛ فلا بد من تحليلها. ولكن كيف يكن تحليلٌ 
هذا القدر الهائل من البيانات؟ حيث لا يمكن تمريرٌ كافة الحسابات إلى جهاز حاسوب واحد. 
فهذا من شأنه إنشاءٌ قدرٍ من أحمال البيانات على هذا الجهاز. وقد El g‏ حل Gis‏ آخر. 
وهو دفع الحوسبة إلى البيانات» بدلاً من دفع البيانات إلى عقدة الحوسبة. وقد كان هذا نموذجًا 
جديدًا وأسفر عن طريقة جديدة GU‏ معالجة البيانات» وهذا ما نعرفه اليوم باسم نموذج برمجة 
MapReduce‏ الذي جعل معالجة البيانات الضخمة حقيقة. وقد تم تطويرٌُ MapReduce‏ في 
الأصل في bg -Google‏ إصدارٌ لاحق من قبل مشروع -Hadoop MapReduce Jaw Apache‏ 


VA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dale‏ على 55« الأعمال والتحليلات وعلم البيانات 


HDES عن التخزين أو المعالجة أو تحليل البيانات الضخمة؛ فإننا نذكر‎ Sas عندما‎ s ls 
الرغم من‎ des معايير وبرامج أخرى ذات صلة.‎ C18 RI عند مستوى معينء وقد‎ MapReduces 
أن مجموعة الأدوات الرئيسة متاحة با مجان؛ فقد تم إطلاق العديد من الشركات لتقديم التدريب‎ 
-Teradata Asters Clouderag Horton Works Jis أو الخدمات المتخصصة في هذا المجال.‎ 

وعلى مدى السنوات القليلة الماضية حدث مزيدٌ من التغير؛ فما كان Sad‏ البيانات الضخمة 
أصبح الآن تطبيقات البيانات الضخمة. وقد أضافت الحاجة إلى معالجة البيانات القادمة As u‏ 
إلى المعادلة. ومن الأمثلة على معالجة البيانات السريعة؛ التداول الخوارزمي. والذي يستخدم 
المنصات الإلكترونية القائمة على خوارزميات تداول 1 ea‏ في السوق LU‏ والتي تعمل في 
غضون الميكروثانية. ومن الأمثلة الأخرى على المجموعة الواسعة من البيانات؛ هو تحليل المشاعن 
والذي يستخدم أشكلاً مختلفةً من البيانات من منصات وسائل التواصل الاجتماعي واستجابات 
العملاء لقياس المشاعر. واليوم» ترتبط البيانات الضخمة Gh‏ نوع من البيانات الكبيرة التي 
تتميرُ بخصائص الحجم والسرعة والتنوع. وتوضّح الحالة العملية 1-١‏ تطبيق تحليلات البيانات 
الضخمة في صناعة الطاقة. وسوف ندرس تقنيات وتطبيقات البيانات الضخمة في الفصل السابع. 


أسئلة مراجعة على القسم :۷-١‏ 

-١‏ ما هي تحليلاتٌ البيانات الضخمة؟ 

-Y‏ ما هي Jolan‏ البيانات الضخمة؟ 

*- ما هي خصائصٌ البيانات الضخمة؟ 

-é‏ ما هي المعالجةٌ الفنية التي يتم تطبيقها لمعالجة البيانات الضخمة؟ 


(1) http//www.cdc.gov/homeandrecreationalsafety/falls/adultfalls.html. 
(2) Gill, T. M., Murphy, T. E., Gahbauer, E. A., et al. (2013). Association of injurious falls with disability 


outcomes and nursing home admissions in community living older persons. American Journal of 
Epidemiology, 178(3), 418-425. 


(3) Gates, S., Smith, L. A., Fisher, J. D., et al. (2008). Systematic review of accuracy of screening instruments 
for predicting fall risk among independently living older adults. Journal of Rehabilitation Research 
and Development, 45(8), 1105-1116. 


Contributors: Harpreet Singh, PhD; Vipin Gopal, PhD; Philip Painter, MD. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري va‏ 


الفصل الأول 


حالة عملية 5-١‏ 
شركة Center Point‏ للطاقة تستخدم التحليلات الفورية للبيانات الضخمة؛ لتحسين خدمة العملاء 

Xs‏ شركة Center Point‏ للطاقة إحدى الشركات الكبرى لتوصيل الطاقة ويقع مقرّها في 
هيوستون» تكساس. وتشمل أعمالها الأساسية نقل وتوزيع الكهرباء» وتوزيع الغاز الطبيعي» 
ومبيعات وخدمات الغاز الطبيعي. ولديها أكثرُ من خمسة ملايين عميل في الولايات امتحدة. 

وتستخدم الشركة شبكات الطاقة الذكية؛ gazd‏ المعلومات الفورية عن صحة 
الجوانب المختلفة للشبكة. مثل: العدادات وا محولات والمفاتيح اللمستخدّمة في توفير 
الكهرباء. ex‏ تحليل هذه المعلومات بشكلٍ فوري باستخدام الطاقة مع تحليلات 
البيانات الضخمة؛ مما يتيخ تش خيصًا Bo‏ وأسرع بكثير. فعلى سبيل المثال: oS‏ أن 
ls‏ وتساعد في gis‏ انقطاع التيار الكهربائي. 

إضافةً إلى ذلك؛ تقوم الشركة gaz‏ بيانات الطقس؛ مما يسمح Ob‏ تساعد البيانات 
التاريخية في التنبؤ بانقطاع التيار نتيجة للعاصفة. وتعمل هذه الرؤية كدليلٍ إرشادي 
لوضع الموارد الصحيحة قبل العاصفة؛ لتجنب حدوث الانقطاع. 

i56‏ ومن أجل أن تفهم عملاءها على نحو أفضل. تستخدم Center Point‏ تحليل 
المشاعر الذي يفحص رأي العميل عن طريق العاطفة (السعادة والغضب والحزنء وما 
لى ذلك)» وتقوم الشركة بتصنيف عملائها بناءً على مشاعرهم ومن ثم تكون $3 على 
لبيع لعملائها بطريقة تستند إلى شخصياتهم وتقدم تجارب أكثر قيمة للعملاء. 

ونتيجةٌ لامتخدام تحليلات البيانات الضخمة:. وفرت الشركة ٠٠٠,٠٠١‏ جالون من 
الوقود في العامين الماضيين؛ من خلال jor‏ ستة ملايين طلب خدمة عن Lax)‏ بالإضافة 
إلى ذلكء وفرت الشركة VE‏ مليون دولار لعملائها في هذه العملية. 





أسئلة للمناقشة: 

-١‏ كيف OSE‏ لشركات الكهرباء التنبؤ بانقطاع ممكن في موقع؟ 

-Y‏ ما هو تحليلٌ مشاعر العميل؟ 

-Y‏ كيف يساعدٌ loa‏ مشاعر العملاء الشركات على تقديم خدمة مُخصّصة لعملائها؟ 


.^ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dole‏ على ذكاء الأعمال والتحليلات وعلم البيانات 


ما الذي هكننا تعلمه من هذه الحالة العملية: 
0 

باستخدام تحليلات البيانات الضخمة؛ يمكن لشركات الطاقة حَل مشكلات العملاء بشكل 
أفضل Jis‏ انقطاع التيار والأعطال الكهربائية في غضون فترة زمنية أقصر مقارنةٌ بالعمليات 
السابقة. كما مكن أن يساعد تحليلٌ ال مشاعر في استهداف عملائهم وفقاً لاحتياجاتهم. 
Sources: Sap.com, "A 'Smart' Approach to Big Data in the Energy Industry; http://www.‏ 
sap.com/bin/sapcom/cs cz/downloadasset.201310--oct-0920-.a-smart-approach-to-‏ 
big-data-in-the-energyindustry-pdfhtml (accessed June 2016); centerpointenergy.‏ 
com, "Electric Transmission & Distribution (T&D); http//www.centerpointenergy.‏ 
com/en-us/Corp/Pages/Company-overview.aspx (accessed June 2016); YouTube.com,‏ 


"CenterPoint Energy Talks Real Time big Data Analytics,” https://www.youtube.com/ 
watch?v-s7CzeSIIEfI (accessed June 2016). 


۸-١‏ نظرة dale‏ على النظام البيئي للتحليلات: 

أنت الآن عزيزي القارئ وبناءً على ما piä‏ مُتحمّسٌ لإمكانات التحليلات وتريد الانضمام 
إلى هذه الصناعة المتنامية. ولكن مَنْ هم اللاعبون الحاليون وماذا يفعلون؟ وما المكان الذي 
يناسبك؟ Ól‏ الهدف من هذا القسم هو odes‏ قطاعاتٍ مختلفة من صناعة التحليلات» وتقديم 
تصنيف للأنواع ا مختلفة من المشاركين في الصناعةء وتوضيح أنواع الفرص اللتاحة dies‏ 
التحليلات. لقد تَمّ تحديدُ أحد عشر lia Ég‏ من اللاعبين في النظام البيئي للتحليلات. كما 
ol‏ فهك النظام البيئي يعطي القارئ do;‏ أوسع لكيفية تلاقي اللاعبين المختلفين. وهناك غر 
ثانوي لفهم النظام البيئي للتحليلات» الخاص بمتخصّعي ذكاء الأعمال Laf‏ وهو أن يكون على 
ele‏ بالشركات والعروض والفرص الجديدة في القطاعات المتحالفة مع التحليلات. ويُختتم القسم 
ببعض الملاحظات عن الفرص المتاحة للمحترفين dol)‏ عبر هذه المجموعات. 

وعلى الرّغم من أن بعض الباحثين قد ميّزوا بين مُتخصّصي تحليل الأعمال وعلماء البيانات 
Davenport)‏ و2012 (Patil‏ كما أشرنا سابقاً بهدف فهم النظام البيئي الشامل للتحليلات؛ 
فإننا نعاملهم كمهنة واحدة واسعة. ومن الواضح أن احتياجات المهارات قد تختلف بين أخصائي 
رياضيات قوي إلى مبرمج إلى مصمم نماذج إلى أخصاني اتصالات» ونعتقد أنَّ هذه المسألة قد 
تمّ halo‏ على مستوى أصغر/ فردي بدلاً من المستوى الكلي لفهم مجموع الفرص. كما ÅD‏ 
تعريقًا واسعًا للتحليلات ليشمل جميع الأنواع الثلاثة وفقاً ل INFORMS‏ وهي الوصفية/ إعداد 
التقارير/ التصويرات» والتنبؤية والتوجيهية كما هو مُوضّح ÁL‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري M‏ 


الفصل الأول 


gés‏ الشكل W-Y‏ وجهة نظر واحدة للنظام البيني للتحليل. إذ fias‏ مكونات النظام 
البيني في بتلات زهرة التحليلات. وقد تم uasa‏ أحد عشر قطاعًا أو قسمًا Lai,‏ في مجال 
التحليلات. giua‏ تجميع مكونات النظام البيئي التحليلي في ثلاث فئات تمثلها البتلات الداخلية, 
والبتلات الخارجية» وبذرة (الجزء الأوسط من) الزهرة. 

ويمكن أن يُطلّق على البتلات الستة الخارجية موردو التقنية. وتأت إيراداتهم من تقديم 
التقنية» والحلولء والتدريب لمنظمات مستخدمي التحليلات؛ حتى يتمكّنوا من توظيف هذه 
التقنيات بأكثر الطرق فعاليةٌ وكفاءةً. ويمكن تعريفٌ البتلة الداخلية بصفة عامة كمسرعات 
التحليلات. وتعمل أجهزةٌ التسريع مع مورّدي التقنية وا مستخدمين. وأخيرا؛ يشتمل جوهر النظام 
البيني على منظمات مستخدمي التحليلات. وهذا هو العنصر الأكثر أهمية؛ إذ يتم دفع JS‏ 
مجموعة من مجموعات صناعة التحليلات من قبل منظمات المستخدمين. 




















شكل :18-١‏ النظام البيئي للتحليلات 

Ól‏ استعارة اسم «زهرة» مناسبٌ تمامًا للنظام البيئي للتحليلات؛ إذ يتداخل العديدٌ من الأشخاص 
بعضهم مع بعض. على غرار كائن حي Jio‏ الزهرة. حيث تنمو كل هذه البتلات وتذوب معاً. 
ونحن نستخدمٌ مصطلحات المكونات والمجموعات والبتلات والقطاعات بشكل متبادل لوصف 
اللاعبين المختلفين في مجال التحليلات. وسنقدّم فيما يلي S‏ من القطاعات الصناعية كما piä‏ 
بعض الأمثلة للاعبين في كل قطاع. إن قائمة أسماء الشركات المُدرّجة في GÍ‏ بتلة ليست شاملة. 
فقائمة الممثلين للشركات في JS‏ مجموعة تهدف فقط إلى توضيح العرض الفريد للمجموعة لوصف 
^Y‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة dale‏ على ذكاء الأعمال والتحليلات وعلم البيانات 


ا مواهب التي يمكن اس تخدامها أو توظيفها. وكذلك؛ OB‏ ذكر اسم الشركة أو قدرتها في مجموعة 
مُحدّدة Y‏ يعني أنها النشاط / العرض الوحيد لتلك المنظمة. والهدف الرئيس؛ هو التركيرٌ على 
القدرات التحليلية المختلفة داخل pais dS‏ من yi» polis‏ التحليلات. وتعمل العديدٌ من الشركات 
في قطاعات متعددة داخل صناعة التحليلات» وبالتالي توفر فرضًا للحركة داخل المجال asi‏ ورأسيًا. 

ولقدقام مات تراك (Matt Turck)‏ - وهو شريك برأس المال مع فرست مارك 
(FirstMark)‏ - بتطوير نظام بيئي للتحليلات يركز على البيانات الضخمة: ويه دف 
إلى تتبع اللاعبين الجدد والقدامى في مختلف قطاعات صناعة البيانات الضخمة. dbg‏ 
صورة مرئية جميلة من ej ds‏ للنظام البيئي وقائمة شاملة من الشركات على موقعه: 
http://mattturck.com/2016/02/01/Big-data-landscape/(accessed ^ August 2016)‏ 
وسنرى أيضاً نظامًا بيئيًا مشابهًا في سياق إنترنت الأشياء (IT)‏ في الفصل الأخير. 








مُورّدو البنية التحتية لتوليد البيانات: 

قد يكون من الأولى أن نبدأ بالتعرّف على هذه المجموعات من خلال ملاحظة مجموعة 
جديدة من الشركات التي تمكّن من توليد وجمع البيانات التي هكن اس تخدامها لتطوير رؤى 
تحليلية. deg‏ الرغم من Ol‏ هذه المجموعة هكن أن تشمل جميع النقاط التقليدية من أنظمة 
البيع» وأنظمة إدارة المخزونء ومُقدَّمِيٍ التقنية JI‏ خطوة في سلس dL‏ عمليات/ قيمة الشركة 
سننظر 2L]‏ في اللاعبين الجدد حيث كان التركيرُ الأسامي على تمكين المنظمة من تطوير رؤى 
جديدة لعملياتها بدلا من تشغيل عملياتها الأساسية. وبالتالي تشمل هذه المجموعة شركات 
إنشاء بنية تحتية لجمع البيانات من مصادر مختلفة. 

ومن المكونات الناشئة لمثل هذه البنية التحتية هو جهاز الاستشعار. حيث تقوم أجهزة 
الاستشعار بجمع كمية هائلة من البيانات معدل E p‏ وقد تم اعتمادها من قبل قطاعات 
مختلفة. مثل: الرعاية الصحية» والرياضةء والطاقة. على سبيل المثالء البيانات الصحية التي 
تجمعها تستخدم أجهزة الاستشعار بشكلٍ ل عام لتتبّع الحالة الصحية للمستخدمين. وبعض أجهزة 
الاستشعار الرئيسة التي تقو تقوم بجمع المعلومات الصحية هي Shimmer Googles .AliveCor‏ 
.Fitbits‏ وبالمثل؛ óe‏ صناعة الرياضة تستخدم أجهزة استشعار لجمع البيانات من اللاعبين 
والميدان لتطوير الإستراتيجيات وتحسين اللعب الجماعي. ومن أمثلة الشركات التي تنتج أجهزة 
الاستشعار ذات àLaJl‏ بالرياضة dass Shockboxg Zepps Sports Sensors‏ كما تُستَخدّم 
أجهزة الاستشعار لإدارة الزيارات. ويساعد ذلك في اتخاذ إجراءات فورية à‏ للتحكّم «bb Jl à‏ 
ومن مورد ردي هذه الخدمة Sensys Networks .Garmins «Advantech B+B SmartWorx‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري AY‏ 


الفصل الأول 


وتلعبٌ أجهزة الاستشعار Doo‏ رئيسًا في إنترنت الأشياء ds‏ جزءًا Gulal‏ من الكائنات الذكية. 
وهي تجعل الاتصال بين آلةٍ وأخرى Saa‏ والجهات الفاعلة الرئيسة في البنية التحتية لإنترنت الأشياء؛ 
هي إنتل (Intel)‏ ومايكروس وفت (Microsoft)‏ وجوجل Google)‏ وآي في إن (IBM)‏ وسيسكو 
(Cisco)‏ وسمارت بين (Smartbin)‏ وسيكو برودكتس (SIKO Products)‏ وأوميجا إنجنيرنج 
(Omega Engineering)‏ وأبل (Apple)‏ وإس إيه بي (SAP)‏ وربما تكون هذه هي المجموعة 
الأكثر un‏ في النظام البيئي. وسوف نستعرضٌ النظام البيئي لإنترنت الأشياء loT‏ في الفصل الثامن. 
وف الواقع؛ يُوجَد تقريبًا نظام ote‏ عن JS‏ مجموعة من المجموعات التي laoi‏ هنا 


9255 البنية التحتية لإدارة البيانات: 


تضم هذه المجموعة gae‏ المنظمات الرئيسة التي توفر الأجهزة والبرامج التي تفسّر الأساس 
الجوهري لجميع حلول إدارة البيانات. ومن الأمثلة الواضحة على ذلك كبار الجهات التي توفر 
البنية التحتية لحوسبة قواعد البيانات» مثل: Oracleg (HP «Dells IBM‏ وما إلى ذلك ومورّدو 
حلول التخزينء مثل EMC‏ (والتي اشترتها Dell‏ مؤخرًا) sNetApps‏ والشركات التي eX‏ منضّات 
الأجهزة والبرمجيات ال محلية Oracles IBM Jis‏ وتيراداتاء ومورّدو حلول البيانات الذين يقدّمون 
dall‏ مستقلةٌ لإدارة قواعد البيانات للأجهزة والبرامج» مثل عائلة SQL Server‏ من مايكروسوفت 
(Microsoft)‏ ويندرجٌ تحت هذه المجموعة Laf‏ مورّدو البرامج المتكاملة التخصّصة مثل SAP‏ 
كما Jaris‏ هذه المجموعة على منظمات أخرى» مثل مورّدي أجهزة قواعد البيانات (odas‏ 
الخدمات والدامجين والمطورين وغيرهم» ممّن يدعمون النظم البيئية لهذه الشركات. 

وتظهر العديدٌُ من الشركات الأخرى باعتبارها لاعبين أساسيين في مجالات ذات صلةء وذلك 
بفضل البنية التحتية للشبكة التي GSE‏ الحوسبة السحابية. وقد اشتهرت شركات Jia‏ (خدمات 
الويب من Salesforce.coms IBM (Bluemix) 5 (Amazon‏ بتقديم حلول مستودعات 
البيانات والتحليلات الكاملة عبر السّحابة» والتي GYI G3‏ اعتمادها من الشركات المذكورة. 

وهناك مجموعة حديثةٌ من الشركات في مجال البيانات iS i aiall‏ هي كذلك le‏ من 
هذه المجموعة. ولا تقوم شركاتٌ Hortonworkss Cloudera |. ia‏ بالضرورة بتوفير الأجهزة 
الخاصة بهم؛ ولكنهم يقدّمون خدمات البنية التحتية والتدريب؛ لإنشاء منصة البيانات الضخمة. 
وهذا يشمل مجموعات Flumes «Kafka «Sparks .NoSQL s .MapReduces Hadoop‏ 
وغيرها من التقنيات المرتبطة بالتحليلات. وبالتالي؛ يمكن laf‏ تجميعهم تحت إشراف استشاريين 
أو مدربين لتمكين البنية التحتية. إِنَّ النظم البيئية الكاملة للاستشاريين وتكامل البرمجيات» 
ومُقدّمي التدريب وغيرهم من مُقَدّمي خدمات القيمة المضافة قد أفادت العديد من اللاعبين 
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الكبار في مجموعة البنية التحتية لإدارة البيانات. وتعمل بعص المجموعات المذكورة abof‏ على 
تحديد هؤلاء اللاعبين؛ لأن العديد منهم ينتقلُ إلى التحليلات؛ إذ Ó)‏ الصناعة تحوّل تركيزها من 
معالجة المعاملات بكفاءة إلى اشتقاق القيمة التحليلية من البيانات. 
9295 مستودعات البيانات: 

ss‏ الشركات التي 355 على مستودعات البيانات التقنية والخدمات التي agi‏ إلى دمج 
البيانات من مصادر متعددة. وبالتالي تمكينْ المنظمات من اس تخلاص وتقديم قيمة من أصول 
البيانات الخاصة بها. وتوفر العديد من الشركات في هذا المجال الأجهزة الخاصة بهم لتوفير 
مستودعات البيانات بكفاءة واسترجاعها ومعالجتها. si‏ 5 شركاتٌ مثل Oracles IBM‏ و 
8 من اللاعبين الأساسيين في هذا المجال. وتش مل التطورات الأخيرة في هذا المجال أداء 
التحليلات على البيانات مباشرةً في الذاكرة. وهناك قطاع 3 كبير آخر هو مستودع البيانات في 
السّحابة» ومن أمثلة هذه الشركات .Redshifts Snowflake‏ وتعمل الشركات في هذه المجموعة 
بوضوح مع جميع الجهات الأخرى في القطاع؛ من أجل توفير حلول وخدمات مستودع البيانات 
ضمن نظامها البيئي وبالتالي تصبح العمود الفقري لصناعة التحليلات. لقد كانت صناعةً رئيسة 
في حَذَّ ذاتهاء وبالتالي» مورد ومستهلك للمواهب التحليلية. 


مُورّدو البرمجيات الوسيطة: 


بدأ مستودعٌ البيانات بالتركيز على جلب جميع مخازن البيانات إلى منصة على مستوى 
المؤسسة. وأصبح إنشاءٌ مغزى لهذه البيانات صناعةٌ في X‏ ذاتها. ويتمثل الهدف العام لقطاع 
البرمجيات الوسيطة في توفير أدوات سهلة الاستخدام للتقارير أو التحليلات الوصفيةء والتي Kas‏ 
جزءًا أساسيًا من ذكاء الأعمال أو التحليلات المُستخدّمة في المنظمات. ومن أمثلة الشركات في هذا 
المجال .Microstrategy. Plum‏ وغيرها الكثير. وقد Q3‏ الاستحوادةٌ على عدد قليلٍ من كبار اللاعبين 
الذين كانوا وسطاء مستقلين من قبل الشركات في dol‏ مجموعتين. فعلى سبيل JUL‏ أصبحت 
Hyperion‏ جزءًا من أوراكل واستحوذت SAP‏ على Business Objects‏ واستحوذت IBM‏ على 
Cognos‏ وقد كان هذا القطاعٌ al s‏ لمورّدي ذكاء الأعمال الذين يقدمون إلى الصناعة خدمات 
لوحة المعلومات والتقارير والتصوير؛ li‏ على بيانات معالجة المعاملات وقاعدة البيانات ومورّدي 
مستودعات البيانات. وهكذا انتقلت العديدٌ من الشركات إلى هذا المجال على $a‏ السنينء ها 
في ذلك 33553 برامج التحليلات العامة مثل SAS‏ أو gadi‏ خدمات مرئية جديدة مثل تابلوه 
(Tableau)‏ أو العديد من podih‏ التطبيقات المتخصّصة. ويورد jau‏ المنتجات في TDWI‏ 
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org 201‏ موردًا فق ط في هذه الفئة؛ وذلك اعتبارًا من يونيو Y - VV‏ لذلك كان القطاع قويًا. 
(http://www.tdwidirectory.cona/category/business-intelligence-services)‏ — ومن 
الواضح o‏ هذا هو القطاع الذي يحاول الانتقال إلى قطاع ele‏ البيانات في الصناعة. 
مُورّدو خدمة البيانات: 

يتم توليدٌ الكثير من البيانات التي تستخدمها المنظمة للتحليلات داخليًا من خلال عملياتها. 
ولكن هناك العديدٌ من مصادر البيانات الخارجية التي تلعب دورًا Uus;‏ في اتخاذ القرار بالمنظمات. 
وتشمل أمثلة مصادر البيانات هذه بيانات التركيبة السكانية, وبيانات الطقسء والبيانات التي & 
جمعها من قبل أطراف ثالثةء والتي يمكن أن تمد المنظمة بمعلوماتٍ مفيدة في auo‏ القرارء وما 
إلى ذلك. وقد انتهز العديدٌ من الشركات الفرصة لتطوير آليات gaz‏ وتكامل وتوزيع البيانات 
المتخصّصة. $35 y‏ هذه الشركات Bale‏ على قطاع صناعي مُحدَّد uz aig‏ إلى علاقاتها القائمة 
في هذه الصناعة من خلال منصاتها المتخصّصة وخدماتها لجمع البيانات. فمثلاً؛ توفر شركة 
Nielsen‏ مصادر بيانات لعملائها حول سلوك الشراء بالتجزئة للعملاء. مثال آخر هو شركة 
Experian‏ والتي تجمع بيانات عن JS‏ أسرة في الولايات المتحدة. وقد طوّرت شركة Ominiture‏ 
i25‏ لجمع نقرات الويب ومشاركة هذه البيانات مع عملائها. $g‏ شركة Comscore‏ إحدى 
كبرى الشركات في هذا المجال. وتقوم Google‏ بتجميع بيانات مواقع الإنترنت الفردية وتقوم 
بعمل مُلخص متاح من خلال خدمات تحليلات جوجل. ومن الأمثلة الأخرى شركات Equifax‏ 
.Aventions «Epsilons .Merkles .Acxioms .TransUnions‏ ومكن أن يشمل ذلك أيضاً 
منظمات مثل ESRLorg‏ والتي توفر بيانات deigh‏ بمواقع عملائها. وهناك مئات الشركات 
الأخرى التي تقوم بتطوير منصات وخدمات متخصصة لجمع وتكامل ومشاركة هذه البيانات 
مع عملائها. وكما ذكرنا سابقًاء يُوجَد العديدٌ من دامجي ومُوزّعي البيانات الخاصة بالصناعة, 
وهم دائمو الحركة لعرض خدمات التحليل الخاصة بهم. وبالتالي؛ And‏ هذا القطاعٌ أيضاً متزايد 
الاستخدام» وموردًا محتملًا diss‏ التحليلات. وخصوصًا مع خبرة مُتخصّصة مُحدّدة. 


مُطوّرو البرامج التي تركز على التحليلات: 

قامت Bid‏ في هذه الفئة بتطوير برامج التحليلات للاستخدام العام مع البيانات التي 3& 
جمعها في مستودعات البيانات أو ا متاحة من خلال إحدى المنصات الأساسية Sodod‏ سابقًا le)‏ 
في ذلك البيانات الضخمة). كما يمكن أن تشمل المخترعين والباحثين في الجامعات وغيرها من 
المنظمات التي طوّرت الخوارزميات وابتكار أنواع Sada‏ من تطبيقات التحليلات. وهكننا تحديدٌ 
كبار اللاعبين في هذا المجال باستخدام أنواع التحليلات الثلاثة: الوصفية: والتنبؤية» والتوجيهية. 
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alae] -‏ التقارير/ التحليلات الوصفية: لقد PLII ÁLS‏ بإعداد التقارير أو التحليلات الوصفية 
من خلال الأدوات التي Uns‏ مش sli‏ البرمجيات الوسيطة المشار إليها AL,‏ أو الإمكانات 
الفريدة التي يُقدّمها مُقدّمو الخدمات ال معنيون. فمثلاً؛ ås gara o As‏ أدوات SQL‏ 
Server BI‏ التابعة لشركة مایکروسوفت (Microsoft)‏ إمكانيات إعداد التقارير فضلاً عن 
التحليلات التنبؤية. ومن ناحية أخرى؛ يتوفر برنامجٌ متخصصٌ من شركاتٍ أخرى مثل تابلوه 
(Tableau)‏ لتصوير البيانات. كما SAS eS‏ أداة التحليلات المرئية ذات السعة نفسها. 
hal duas‏ من أدوات التصوير المجانية أيضاً. وقد تمّ تطويرٌ مئات أدوات تصوير البيانات 
في جميع أنحاء العام وترز العديدٌ من هذه الأدوات على رؤية البيانات المتوفرة لصناعة أو 
مجال معين. ولأن التصويرٌ هو الطريق الأساسي حتى الآن لاستكشاف التحليلات في مجال 
الصناعة؛ فقد g$‏ هذا القطاع نموًا أكبر. lo eos‏ تأسيسٌ العديد من الشركات الجديدة. 
فمثلاً يركز برنامج Gephi‏ المجاني وابمفتوح المصدر على تصوير الشبكات. وسوف يظهر في 
البحث على Google‏ أحدث قائمة لمقدّمي مثل هذه البرامج والأدوات. 
- التحليلات التنبؤية: Jalg‏ هذه الفئة قد شهدت أكبر نمو في العصر الحديث في مجال التحليلات» 
وهناك Sa e‏ كبيرٌ من الشركات التي تركّز على التحليلات التنبؤية. وقد تبنت العديدٌ من 
شركات البرمجيات الإحصائيةء مثل SPSSs SAS‏ التحليلات التنبؤية في cs‏ مبكرء كما طؤّرت 
إمكانيات البرامج» وكذلك ممارساتٌ الصناعة لاستخدام أساليب التنقيب في البيانات والأساليب 
لإحصائية الكلاسيكية للتحليلات. ومن أمثلة الأدوات dados Lal‏ للتحليلات التنبؤية IBM-‏ 
SPSS Modeler‏ من Enterprise Miners IBM‏ من -SAS‏ ويشمل اللاعبون الآخرون في هذا 
لمجال شركة Statsofts KXEN‏ (التي اشترتها Dell‏ مؤخرًا) Salford Systemss‏ وكثيرٌ من 
الشركات الأخرى التي قد تبيع برامجها على نطاق واسع أو تستخدمها في ممارسات الاستشارات 
لخاصة بها (المجموعة التالية من الشركات). 
كما ظهرت ثلاث منصات مفتوحة المصدر أخرى» وهي (KNIMEs RapidMiners R)‏ كأدوات 
برمجية شائعة في المجال الصناعي للتحليلات التنبؤيةء ولديها EÀ‏ تدعم تدريب وتنفيذ هذه 
لأدوات المجانية. Jis‏ شركة Revolution Analytics‏ والتي ترگز على تطوير R‏ والتدريب. 
ويكون R Jol‏ ممكنًا مع معظم برامج التحليلات. وتستخدم شركة تدعى Alteryx‏ امتدادات 
R‏ لإعداد التقارير والتحليلات التنبؤية» غير أن قوتها $53 في تقديم عمليات حلول التحليلات إلى 
العملاء والمستخدمين الآخرين بشكل مشترك. وبالمثل؛ فإن RapidMiner‏ وKNIME‏ هما أيضاً 
أمثلة بمورّدي البرامج مفتوحة المصدر. كما أن شركات Rulequest Jis‏ التي تبيع متغيرات الملكية 
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من برامج «NeuroDimensions 5 Decision Tree‏ وهي شركة برمجيات „Neural Network‏ 
هي iif‏ على الشركات التي طوّرت برامج مُتخصّصة حول أساليب مُحدّدة للتنقيب في البيانات. 
- التحليلات التوجيهية: يُقذّم مُورّدو البرمجيات في هذه الفئة أدواتٍ النمذجة والخوارزميات؛ من 
أجل تحسين أمثل للعمليات التي Bale‏ ما Aa‏ برمجيات علم الإدارة/ بحوث العمليات. وكان 
لهذا ا لمجال مجموعةٌ خاصةٌ من JUS‏ مورّدي البرمجيات. فعلى سبيل JEL‏ لدى IBM‏ برامج 
البرمجة الخطية الكلاسيكية: والمختلطة: والبرمجة الصحيحة. وقبل عدة سنوات» استحوذت 
Lal IBM‏ على شركة تُدعَى ILOG‏ والتي pii‏ خدمات التحليل التوجيهي والخدمات 
التكميلية لكمّل عروضها الأخرى. ومُقدَّمو التحليلات مثل SAS‏ لديهم أدوات OR/MS‏ 
الخاصة بهم - .SAS/OR‏ واستحوذت شركة FICO‏ على شركة أخرى تُسمّى XPRESS‏ توفر 
برنامجًا للتحسين. وتشمل الجهات الفاعلة الرئيسة الأخرى في هذا المجال شركات مثل (AIIMS‏ 
وآطللف «NGDatas .Maximals Lindo Systemss .Gurobis .GAMSs Frontlineg‏ 
Ayatas‏ وغيرها الكثير. إن التحديد والوصف التفصيلي لعروض هذه الشركات هو خارج نطاق 
أهدافنا هنا. ويكفي القول Ob‏ هذا القطاع الصناعي قد سهد نموًا كبا في الآونة الأخيرة. 
وبالطبع؛ desi‏ العديدٌ من الأساليب التي تندرج تحت فئة التحليلات التوجيهية. ولكلّ 
منها Ae gana‏ خاصةٌ بها من مُقَدّمي الخدمات. فعلى سبيل المثال؛ يتم تقديمٌ برامج المحاكاة 
من قبل الشركات الكبرى مثل Slinkg Rockwell (ARENA)‏ ويوفر Palisade‏ الأدوات التي 
تتضمّن Lal‏ من فئات البرامج. وبا مثلء تقدّم Sho Frontline‏ للتحسين باستخدام جداول 
بيانات Excel‏ بالإضافة إلى التحليلات التنبؤية. ويمكن dis‏ تحليل القرار في إعدادات متعددة 
الأغراض باستخدام أدوات .Expert Choice Jis‏ وهناك أيضاً أدوات من شركات مثل Exsys‏ و 
XpertRule‏ وغيرها لإنشاء قواعد بشكلٍ مباشر من البيانات أو مدخلات الخبراء. 
وتتطوّر بعص الشركات الجديدة لتجمع بين نماذج التحليلات المتعددة في مجال البيانات 
الضخمة» ها في ذلك Jalos‏ الشبكات الاجتماعيةء والتنقيب في تيار البيانات. فعلى سبيل المثال» 
تضمن Teradata Aster‏ إمكانيات التحليلات التنبؤية التابعة له في معالجة تدفقات البيانات 
الضخمة. وقد قامت العديدٌ من الشركات بتطوير محركات معقدة معالجة الأحداث (CEP)‏ تتخذ 
قرارات باستخدام بيانات التدفق» مثل IBM Infosphere Streams‏ ومايكروسوفت (Microsoft)‏ 
UT Oracle Event Processors StreamlInsights‏ الشركاث الكبرى الأخر: ى التي تمتلك منتجات 
محركات معالجة الأحداث المعقدة؛ فتشمل SAPs dnformaticas .Tibcos «Apache‏ و 
-Hitachi‏ وتجدرٌ الإشارة ya‏ أخرى إلى أنَّ مجموعات المورّد لجميع فئات التحليلات الثلاث ليست 
حصريةً. ds‏ معظم الحالات؛ هكن للمورد أن يلعب في مكونات متعددة من التحليلات. 
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ed is‏ بعد ذلك «البتلات الداخلية» لزهرة التحليلات. ويمكن تسمية هذه المجموعات 
مسرعات التحليلات. وعلى الرغم من أنهم قد لا يشاركون في تطوير التقنية مباشرةً؛ فقد لعبت 
هذه المنظمات دورًا رئيسًا في تشكيل هذه الصناعة. 


مُطوّرو التطبيق: صناعة مُحدّدة أو عامة: 

تستخدم المنظماتٌ في هذه المجموعة معرفتها الصناعيةء وخبرتها التحليليةء وحلولها المتاحة للبنية 
التحتية للبيانات» ومستودعات البيانات, والبرامج الوسيطة ومجمّعي البيانات ومُقدمي برامج التحليل 
[SI‏ لتطوير حلول مُخصّصة لصناعة معينة. وبالتالي؛ تتيح هذه المجموعة الصناعية إمكانية استخدام 
تقنية التحليلات في صناعة معينة. وبالطبع؛ قد تُوجَّد مثل هذه المجموعات أيضاً في منظمات مستخدمين 
مُحدّدة. ومن الواضح ol‏ معظم مُورّدي تقنية التحليلات الأساسيين مثل IBM‏ و5485 Teradatas‏ 
يتعرفون على فرصة الاتصال بصناعة مُحدّدة أو عميل adah‏ وتقديم خدمات استشارية تحليلية. تقوم 
الشركاثٌ التي قدّمت بشكل تقليدي حلول بيانات/ تطبيقات لقطاعات adah‏ بتطوير عروض تحليلية 
خاصة بالصناعة. فعلى سبيل ال مثالء eX‏ شركة Cerner‏ حلول السجلات الطبية الإلكترونية لمقدّمي 
الخدمات dubli‏ وتشمل عروضها الآن العديدٌ من تقارير التحليلات والمرئيات. وبالمثل eS‏ شركة 
IBM‏ محرك كشف الاحتيال لصناعة التأمين الصحيء وتعمل مع شركة تأمين لاستخدام منصة تحليلات 
Watson‏ الشهيرة في مساعدة paih‏ الخدمات الطبية وشركات التأمين في التشخيص وإدارة المرض. 
ومن الأمثلة الأخرى على مُورّدي تطبيقات رأسية Sabre Technologies‏ التي ei‏ حلولًا illos‏ 
لصناعة السّفر ا في ذلك تسعير التعريفات لتحسين الإيرادات وتخطيط الإرسال. 

وتشمل هذه المجموعة أيضاً الشركاتٍ التي طوّرت حلول تحليلات خاصة بمجالها وتسوقها 
على نطاق واسع لقاعدة العملاء. وعلى سبيل «JUL‏ تقوم Sportvisiong IBM 5 Nike‏ بتطوير 
تطبيقات في التحليلات الرياضية لتحسين اللعب وزيادة نسبة المشاهدة. ولقد طوّرت Acxioni‏ 
مجموعاتٍ SJ‏ المنازل في الولايات المتحدة تقريبًا استنادًا إلى البيانات التي تجمعها حول الأسر 
من مصادر مختلفة. وتنتمي شركات إعداد التقارير ذات الدرجات الائتمانية والتصنيف FICO)‏ 
...Experians‏ إلخ) أيضاً إلى هذه المجموعة. وتقدّم IBM‏ والعديد من الشركات الأخرى حلول 
تحسين الأسعار في قطاع بيع التجزئة. 

ويمثل هذا المجال dob ios‏ لتطوير تطبيقات خاصة بالقطاع. ويحاول الكثيرون الذين 
يظهرون في تحليلات الويب/ الشبكات الاجتماعية/ المواقع أن يقوموا بتهيئة المستخدمين للاستهداف 
الأفضل للحملات الترويجية في الوقت المناسب. ومن أمثلة هذه الشركات وأنشطتها: تقوم شركة 
باستخدام بيانات الموقع لتطوير ملفات تعريف ال مس تخدمين/ المجموعات واستهداف 
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إعلانات الجوالء ومس تخدمي ملفات تعريف Towerdata‏ على أساس استخدام البريد الإلكتروني. 
وتهدف شركة Qualia‏ إلى تحديد ال مس تخدمين من خلال gar‏ استخدامات الجهازء وتستهدف 
Simulmedia‏ الإعلانات التلفزيونية على أساس تحليل عادات مشاهدة التلفزيون لدى المستخدم. 

ولقد أنتج $ الهواتف LSI‏ صناعةً كاملةً 355 على تطبيقات تحليلات dadoh‏ للمستهلكين وكذلك 
المؤسسات. فعلى سبيل المثال: هكن لتطبيقات الهواتف الذكية Shazam Jès‏ أو Soundhound‏ أو 
Musixmatch‏ تحديد أغنية على أساس المشاهذات القليلة الأول ثم السماح للمستخدم باختيارها 
بغرض التشغيل/ التنزيل/ الشراء. وتستخدم Waze‏ معلومات المرور الفورية التي يشاركها المستخدمون. 
بالإضافة إلى بيانات الموقع لتحسين التنقل. وتؤدي أدوات التعرّف على الصوت مثل Siri‏ على iPhone‏ 
Amazon Alexas Google Nows‏ إلى العديد من تطبيقات التحليلات الأكثر Lúas‏ 
لأغراض مُحدّدة جدًا في التحليلات المطبّقة على الصور ومقاطع الفيديو والصوت والبيانات 
الأخرى التي يمكن التقاطها من خلال الهواتف الذكية و/أو أجهزة الاستشعار المتصلة. لقد 
رفعت الهواتف الذكية Laf‏ من موردي الخدمات الاقتصادية المشتركة مثل: «Uber‏ 
Olas Curbs Lyftg‏ إِنَّ العديد من هذه الشركات؛ هي أمثلة للتحليلات التي تؤدي إلى فرص 
أعمال جديدة. 59 وسائلٌ التواصل الاجتماعي عبر الإنترنت مجالًا آخر ساخنًا في هذه المجموعة. 
ومما لا شك فيه أن Facebook‏ هو اللاعب الأساسي في مجال الشبكات الاجتماعية عبر الإنترنت يليه 
Leg .Linkedln Twitter‏ على ذلك؛ ÓL‏ الوصول العام إلى بياناتهم S‏ إلى ظهور شركات أخرى 
متعددة تقوم بتحليل بياناتها. فعلى سبيل المثال: تقوم Unmetric‏ بتحليل بيانات Twitter‏ وتوفير 
الحلول لعملائهاء وبالمثل,» يُوجَد العديدُ من الشركات الأخرى التي ترز على تحليل الشبكات الاجتماعية. 

ومن المجالات الموجّهة في مجال تطوير التطبيقات إنترنت الاشياء JOT‏ وتقومٌ العديدٌ من 
الشركات ببناء تطبيقات لصنع كائنات ذكية. Ñas‏ طوّرت شركة SmartBin‏ أنظمة المراقبة 
الذكية عن بُعد لقطاعات النفايات وإعادة التدوير» وتعمل العديدٌ من المنظمات الأخرى على 
بناء العدّادات الذكية والشبكات الذكية والمدن الذكية والسيارات المتصلة والبيوت الذكية 
وسلاسل التوريد SII‏ والصحة المتصلة والتجزتة ASII‏ وغيرها من الأشياء الذكية. 

gaisg‏ هذا النشاط في بداية الأمر ليتحوّل إلى مرحلة انتقالية كبيرة بسبب مشكلات في التمويل/ 
الاستثمار والمشكلات الأمنية/ الخصوصية. وعلى الرغم من ذلك؛ فقد يكون قطاع مطؤري التطبيقات 
هو 551 مجال للنمو داخل التحليلات في هذه المرحلة. وتوفر هذه المجموعة فرصةً فريدةً لمحترفي 
التحليلات الذين يبحثون عن المزيد من خيارات مهنة تنظيم المشاريع. 
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giai‏ صناعة التحليلات والمؤثرون فيها: 

وتشمل المجموعة التالية من صناعة التحليلات ثلاثة أنواع من المنظ مات أو المحترفين؛ 
المجموعة الأولى هي مجموعةٌ من المنظمات المهنية التي pi‏ المشورة إلى مورّدي صناعة 
التحليلات والمستخدمين. تشمل خدماتهم تحليلات تسويقية وتغطية التطورات الجديدة وتقييم 
تقنيات bados‏ وتطوير التدريب/ الورقات البيضاء وما إلى ذلك. ومن أمثلة هذه المجموعة 
منظمات مثل مجموعة جارتنر. ومعهد مستودعات „McKinsey g Forrester g OLLI‏ 
والعديد من المنشورات العامة والفنية ومواقع الويب التي تغطي صناعة التحليلات. وتتميز 
مجموعة ماجيك كوادرانتس التابعة لمجموعة جارتنر بكونها مؤثرةً للغاية وتعتمد على عمليات 
الممسح في الصناعة. وبالمثل, $g‏ محترفو dale coL adl TDWLorg‏ ممتازة عن الصناعة» وهم 
يدركون GLE‏ الاتجاهات الحالية والمستقبلية لهذه الصناعة. 

وتضم المجموعة الثانية مجتمعات أو شركات مهنية pii‏ أيضاً Lån‏ من الخدمات نفسها؛ 
ولكنها 428 على أساس منظم. فعلى سبيل JEL‏ يركز dze OYI‏ بحوث العمليات وعلم الإدارة 
INFORMS‏ وهي شركة مهنيةء على تعزيز التحليلات. وتركز مجموعة المصالح الخاصة لدعم 
القرار والتحليلات» وهي مجموعة فرعية تابعةٌ لرابطة نظم المعلومات» أيضاً على التحليلات. كما 
Ol‏ لدى معظم المورّدين الرئيسيين (مثل: تيراداتاء و545) مجموعات المستخدمين الخاصة بهم. 
وتشجّع هذه الكيانات استخداة التحليلات وتمكّن من مشاركة الدروس المستفادة من خلال 
منشوراتها ومؤتمراتهاء وقد توفر أيضاً خدمات التوظيف. وبالتاي» مصادر جيدة لتحديد المواهب. 

Ld‏ المجموعة الثالثة من ohl‏ في مجال التحليلات؛ فهي ما نسميه سفراء التحليلات» أو 
المؤثرين» أو القائمين بالدعاية. وقد أبدى هؤلاء المحللون حماسهم للتحليلات من خلال حلقاتهم 
الدراسيةء وكتبهم ومنشورات أخرىء وتشمل هذه المجموعة على سبيل المثال لا الحصر Steve‏ 
bill Frankss Wayne Eckersons «Charles Duhiggs «Tom Davenports Baker‏ و 
bill Inmans .Claudia Imhoffs Malcolm Gladwell‏ وغيرهم. ولدى ds‏ هؤلاء السفراء 
مؤلفات (بعضها من الكتب الأكثر مبيعًا) و/أو قذّموا العديدَ من العروض التقدهية لترويج تطبيقات 
التحليلات. وقد يكون هناك مجموعة أخرى من المؤثرين لذكرها هناء وهم مؤلفو الكتب المدرسية 
عن تحليلات ذكاء الأعمال الذين يهدفون إلى مساعدة المجموعة التالية لإنتاج محترفي صناعة 
التحليلات. ومن الواضح أنَّ الأمر سيستغرق بعض الوقت؛ لكي يصبح طالب التحليلات عضوًا في 
هذه المجموعة؛ ولكنه يستطيع العمل مع أعضاء من هذه المجموعة كالباحثين أو المتدربين. 
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المعاهد الأكاديمية ووكالات الاعتماد: 

تستمدٌ أي صناعة كثيفة المعرفة, مثل التحليلات؛ Gia‏ الأماسية من جذب الطلاب المهتمين 
بالتقنية واختيار هذه الصناعة كمهنة لهم. وتلعبُ الجامعات دورًا ريسا في Jug‏ ذلك Kaa‏ 
plis‏ هذه المجموعة, البرامج الأكادهية التي i$‏ المهنيين لهذه الصناعة. وهي jais‏ مكوناتِ 
مختلفةً من كليات إدارة الأعمالء Jia‏ نظم المعلومات والتسويق وعلوم الإدارة وما إلى ذلك. 
كما izg‏ إلى ما هو أبعد من المدارس التجارية لتشمل أقسام علوم الحاسب والإحصاء والرياضيات 
والهندسة الصناعية في جميع أنحاء العالم. كما Årg‏ كذلك لتشمل ما يتجاوز مُطوّري الرسومات 
الذين يُصمّمون طرقًا جديدةٌ لتصوير المعلومات. piis‏ الجامعات برامج البكالوريوس والدراسات 
العليا في التحليلات في جميع هذه التخصصات. على الرغم من اختلاف التسميات. وقد اشتملت 
إحدى نطاقات النموٌ الرئيسة في برامج الشهادات على التحليلات؛ لتمكين المتخصّصين الحاليين من 
إعادة تدريبهم وإعادة تنظيم أنفسهم في وظائف التحليلات. وتمكّن برامج الشهادات الممارسين 
من اكتساب الكفاءة الأساسية في برامج معينة عن طريق الحصول على عدد Jald‏ من الدورات 
المهمة بالمدارس التي eX‏ هذه البرامج. وتتضمّن شبكة جامعة تيراداتا ÄB‏ ببرامج التحليلات, 
والتي 10١ Jais‏ برنامجًا تقرييّه وتتزايد يوميًا. 

وتساعدٌ مجموعة أخرى من اللاعبين في تطوير الكفاءة في التحليلات. odas‏ هي برامج 
الشهادات التي تنح شهادة الخبرة في برامج Baiah‏ ويقدّم كل مورّدي التقنية الأساسية تقريبًا 
y G)‏ إم (IBM)‏ ومايكروسوفت (Microsoft)‏ ومايكروستراتيجي «(Microstrategy)‏ وأوراكل 
(Oracle)‏ وإس !45 إس (SAS)‏ وتابلوه (Tableau)‏ وتيراداتا ‘[(Teradata)‏ برامج الشهادات 
الخاصة بها. وتضمّن هذه الشهاداتٌ أن يتمتع الموظفون المحتملون الجُدد بمستوّى معين من 
الأدوات المهارية. ومن ناحية أخرى؛ تقدّم INFORMS‏ برنامج شهادة Certified Analytics‏ 
gila Professional‏ يهدف إلى اختبار الكفاءة التحليلية العامة لشخص ما. أي إِنَّ هذه 
الشهادات تمنح GJI‏ الجامعيّ مهارات إضافية LB‏ للتسويق. 

Së Lx)‏ البرامج الأكادهية في التحليلات Koi‏ مذهلا. ados‏ الوقت فقط ما إذا كانت هذه 
المجموعة تفرط في 8365 السعة التي هكن أن تس تهلكها المجموعات الأخرى. ولكن في هذه 
المرحلة. يبدو أن الطلبَ يفوق المعروض من خريجي التحليلات ال مؤهلينء وهذا هو المكانُ الأكثر 
وضوحًا للعثور على مستخدمي التحليلات المبتدئين على الأقل. 
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المنظمون eios‏ السياسات: 

يُعتَبر اللاعبون في هذا المكوّن مسؤولين عن تحديد القواعد واللوائح الخاصة بحماية موظفي» 
M aes‏ وحاملي أسهم منظمات التحليلات. ويتطلّب جمعٌ ومشاركةٌ بيانات العميل قوانينَ 
fojlo‏ لتأمين الخصوصية. تقوم عدة منظمات في هذا ا مجال بتنظيم عملية نقل البيانات وحماية 
حقوق المستخدمين. فعلى سبيل المثال: ea‏ لجنة الاتصالات الفيدرالية (FCC)‏ الاتصالات بين 
الدول والاتصالات الدولية. وبالمثل. فإن لجنة التجارة الفيدرالية (FTC)‏ هى المسؤولة عن 
عرض الممارسات التجارية غير المشروعة المتعلقة بالبيانات. e lado‏ الاتحاد الدولي للاتصالات 
(ITU)‏ الوصول إلى تقنية المعلومات والاتصالات (ICTs)‏ للمجتمعات غير المخدومة في جميع 
أنحاء العالم. ومن ناحية أخرى؛ As az:‏ فيدراليةٌ غير نظامية anl! AUS‏ الوطني للمعايير 
والتقنية (NIST)‏ تساعد على تقدّم البنية التحتية للتقنية. كما أنَّ هناك العديدَ من المنظمات 
الأخرى في جميع أنحاء العام التي تنظم أمن البيانات وتدفع عجلة صناعة التحليلات. liag‏ 
Gao oso‏ النظام البيئي» وبالتالي لا يمكن لأحد أن egas‏ استخدامَ معلومات المستهلكين. 

وبالنسبة GY‏ شخصٍ يقومٌ بتطوير أو استخدام تطبيقات التحليلات» رها يكون من الضروري 
أن يكون هناك شخصٌ ما في الفريق على علم بالإطار التنظيمي. ومن الواضح df‏ هذه الوكالات 
والمنظمات المهنية التي تعمل معهم يقدّمون مواهبَ ومهارات فريدة في مجال التحليلات. 
منظمات مُستخدمي التحليلات: 

من الواضح d‏ هذا هو المحرك الاقتصادي لصناعة التحليلات بأكملهاء وبالتالي؛ فإننا Ée‏ هذه 
المجموعة باعتبارها jagr‏ زهرة التحليلات. وإذا م يكن هناك مستخدمون؛ فلن تكون هناك 
صناعةٌ تحليلات. إن المنظمات في delo JS‏ بغض النظر عن حجمها وشكلها وموقعها؛ تستخدمٌ 
أو تستكش ف استخدام التحليلات في عملياتها. وتشمل هذه المنظمات القطاع الخاصء والحكومة 
والتعليم, والعسكريةء وما شابهها؛ بل وتشمل المنظمات في جميع أنحاء العالم. وهناك أمثلةٌ على 
استخدامات التحليلات في صناعات مختلفة كثيرة. ويستكشف آخرون فرضًا ABl‏ محاولة الحصول 
على مَيْزة تنافسية أو الاحتفاظ بها. وم يتم تحديد شركات مُحدَّدة في هذا القسم؛ وبدلًا من ذلك؛ 
فإن الهدف هنا هو معرفةٌ نوع أدوار محترفي التحليلات التي يمكن أن يلعبها داخل منظمة المُستخدم. 

وبالتاكيد؛ d$‏ القيادةٌ العليا للمنظمة لا سيما في مجموعة تقنية المعلومات (مسؤول المعلومات» 
وما إلى ذلك) أمرًا بالغ الأهمية في تطبيق التحليلات لعملياتها. ويقول Forrest Mars‏ من إمبراطورية 
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الإدارات تُغالي في تطبيق الرياضيات على عمليات واقتصاديات الشركة». 


الفصل الأول 


ئ للشوكولاتة: ol»‏ جميعَ 


وعلى الرغم من عدم تأييد عدد كاف من كبار المديرين لهذا الرأي؛ OB‏ الوعي بتطبيق التحليلات 
داخل المنظمة ينمو في US‏ مكان. ولقد أخبرنا مسؤول تنفيذي في شركة تأمين صحي ذات مرة أنَّ 


الشركة كمنظمة GE‏ تقنية المعلومات من جمع الأموال من الأعضاء 


(المدير التنفيذي) ينظر إلى 


المؤمّن عليهم وتوزعها على المورّدين. وهكذا كانت الكفاءة في هذه العملية؛ هي الخاصية التي هكن 
أن يتفوقوا بها على المنافس. وقد أَدّى هذا إلى تطوير العديد من تطبيقات التحليلات لتقليل الاحتيال 


الخدمات» وتعزيز العافية بين GASI‏ عليهم؛ حتى يستخدموا موزدي 
اد وتوليد المزيد من الكفاءة في ا معالجةء وبالتالي تكون S]‏ ربحيةٌ. 


والمدفوعات الزائدة qal‏ 
الخدمات بمعدل أقل من المعتا 


ومن الناحية الفعلية؛ OB‏ جميع المنظمات الرئيسة في كل صناعة محل الاهتمام؛ توظّف محترفي التحليلات 
تحت مُسميات وظيفية مختلفة. dads‏ الشكل 14-١‏ تصويرًا لكلمة واحدة من عناوين مختارة من خريجي 





الحكومية من عام ۲۰۱۲ إلى عام ids Y VV‏ بوضوح ol‏ تحليلات وعلم 


برنامجنا في جامعة أوكلاهوما 


البيانات هي عناوين شائعة في المنظمات التي توظف خريجي هذه البرامج. وتظهر الكلمات الرئيسة الأخرى 
لنتضمّن مصطلحات مثل المخاطر وقواعد البيانات والأمن. والإيرادات والتسويق» وما إلى ذلك. 
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وبالطبع؛ تتضمّن منظماتٌ المستخدمين مساراتٍ مهنية Rx‏ التحليلات للانتقال إلى مواقع 
الإدارة. وتشمل هذه المسميات الوظيفية مديري المشروعات» وكبار المديرين» والقادة. وصولا إلى 
رئيس قسم المعلومات أو الرئيس التنفيذي. وهذا يشير إلى GÍ‏ منظمات المستخدمين موجودة 
كمجموعة رئيسة في النظام البيئي «alo‏ وبالتالي يمكن أن يكون مصدرًا جيدًا للمواهب. ls.‏ 
يكون هذا هو المكان الأول لإيجاد محترفي التحليلات في قطاع الصناعة الرأسية. 

وكان الغرض من هذا القسم هو تقديمٌ لمحة سريعة عن agih‏ صناعة التحليلات. وقد تم 
١١ d aded‏ مجموعةً مختلفةً Lab‏ دورًا رئيس ا في elo‏ هذه الصناعة وتعزيزها. ويمكن إضافة 
المزيد من البتلات/ المكونات هرور الوقت في زهرة/ نظام التحليلات. ونظرًا لأن تحليلات البيانات 
تتطلّب مجموعة متنوعةً من المهارات؛ فإن Gab‏ هذا النظام البيني يوفر لك خيارات أكثر مما 
قد تتخيل لمهن التحليلات. وعلاوةٌ على ذلك؛ هكن للمحترفين الانتقال من مجموعة صناعية إلى 
أخرى للاستفادة من مهاراتها. فعلى سبيل المثال: يمكن للخبراء ا محترفين من مُقَدّمي الخدمات في 
بعض الأحيان الانتقال إلى مراكز الاستشارات» أو مباشرةً إلى منظمات المستخدمين. وبشكل tele‏ 
هناك الكثيرُ مما ts‏ الحماسة حول صناعة التحليلات في هذه المرحلة. ١‏ 





أسئلة مراجعة على القسم :۸-١‏ 

-١‏ قم بإدراج t$ ١١‏ من اللاعبين في النظام البيئي للتحليل. 

-Y‏ أعط Ala]‏ لشركات في كل واحد من ال ١١‏ نوعاً من اللاعبين. 

-Y‏ ما هي الشركات المهيمنة في أكثر من فئة؟ 

-é‏ هل من الأفضلٍ أن تكونَ أقوى لاعب في فئة واحدة أو أن تكون نشطًا في فئات مُتعدّدة؟ 


9-١‏ خطة الكتاب: 

لقد منحتك الأقسامٌ السابقة Ua‏ لحاجة تقنية ا معلومات في auo‏ القرارء وتطوّر ذكاء الأعمال» 
والآن إلى التحليلات وعلم البيانات. وقد 38 في الأقسام العديدة الأخيرة نظرةً ole‏ على أنواع 
مختلفة من التحليلات وتطبيقاتها. والآن نحن مستعدون للقيام برحلة إرشادية أكثر تفصيلًا في 
هذه المواضيع؛ إلى جانب بعض الخبرة العملية العميقة في بعض ا موضوع ات الفنية ويوضح 
الشكل ١0-١‏ خطة حول بقية الكتاب. 
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الاتجاهات المستقبلية 
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الادارية فى التحلبلات‎ 








شكل :10-١‏ خطة الكتاب 

في هذا الفصل؛ تم عرض مقدمة وتعريفات ونظرة عامة على أنظمة دعم القرار DSSs‏ وذكاء 
الأعمال والتحليلات» ها في ذلك تحليلات البيانات الضخمة oleg‏ البيانات. كما Lads‏ نظرةً عامةٌ 
على النظام البيئي للتحليلات لتقدّر مدى اتساع وعمق هذه الصناعة. ohig‏ الفصلان الثاني 
والثالث المسائل التحليلية الوصفية والبيانات. وتشكّل البيانات غالبًا الأماس S‏ تطبيق تحليلي. 
وبالتالي نقومٌ بعرض مقدمة حول مسائل مستودعات البيانات والتطبيقات والتقنيات. ويغطي 
هذا gaill‏ أيضاً تقنيات وتطبيقات التقارير وتطبيقات الأعمال. ويتبع ذلك نظرة عامة مختصرة 
على أساليب وتطبيقات إدارة أداء الأعمال BPM‏ وهو الموضوع الذي كان جزءًا أساسيًا من ذكاء 
الأعمال التقليدي. 





La casis‏ التالي التحليلات التنبؤية؛ إذ يُقدّم الفصل الرابع مقدمةً لتطبيقات التحليلات 
التنبؤية» ويتضمّن العديدٌ من الفنيات الشائعة للتنقيب في البيانات وهي: التصنيف والتجميع 
وأساليب الترابطء وغيرها. ويرگز Jall‏ الخامس على تطبيقات التنقيبب في النضٌ بالإضافة إلى 
تحليلات الويب» ها في ذلك تحليلات وسائل التواصل الاجتماعي وتحليلات المشاعر. وغيرها 
من الموضوعات ذات ghg ALAI‏ الفصل السادس التحليلات التوجيهية. ويتضمّن الفصل 
السابع مزيدًا من التفاصيل حول تحليلات البيانات الضخمة. ويتضمّن haill‏ الثامن مناقشة 
الاتجاهات الحديثة الظهور. مما يؤدي إلى انتشار JS‏ من الأجهزة اللاسلكيةء وأجهزة «GPS‏ 
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وأجهزة الاستشعار الأخرى وإنشاء قواعد بيانات ضخمة جديدة وتطبيقات فريدة من نوعها. 
وقد بدأت مجموعةٌ جديدةٌ من شركات التحليلات في الظهور لتحليل قواعد البيانات الجديدة 
هذه؛ من أجل فهم أفضل وأكثر عمقًا لس لوكيات وتصرّفات العملاءء وهو ما يؤدي إلى وَضْع آلية 
للتحليلات els‏ إلى مجال جديد GÀ ad‏ إنترنت الأشياء La ad esos IoT‏ التحليلات 
المستندة إلى السحابة. Tasio‏ يحاول Lail‏ الثامن أيضاً دمج جميع المواد التي يغطيها هذا 
الكتاب» ويُختتم بمناقشة موجزة لأبعاد الأمان/ الخصوصية في التحليلات. 


٠١-١‏ مواردء وروابطء واتصال شبكة جامعة تيراداتا: 
هكن تعزيرٌ استخدام هذا الفصل ومعظم الفصول الأخرى في هذا الكتاب من خلال الأدوات 
الموضّحة في الأقسام التالية. 
الموارد والروابط: 
نوصي باطوارد والروابط الرئيسة التالية: 
The Data Warehousing Institute (tdwi.org)‏ - 
Data Science Central (datasciencecentral.com)‏ - 


- DSS Resources (dssresources.com) 


- Microsoft Enterprise Consortium (enterprise.waltoncollege.uark.edu/mec.asp) 


المورّدون والمنتجات والنسخ التجريبية: 
eX‏ معظمٌ الموردين Gud‏ تجريبية لمنتجاتهم وتطبيقاتهم. وتتوافر معلوماتٌ حول المنتجات 
والبنية والبرمجيات على -dssresources.com‏ 
النشرات الدورية: 
نوصي بالنشرات الدورية التالية: 
Decision Support Systems (www.journals.elsevier.com/decision-support-systems)‏ - 


- CIO Insight (cioinsight.com) 
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اتصال شبكة جامعة تيراداتا: 

يرتبط هذا الكتاب bU‏ وثيقًا بالموارد المجانية التي تقدّمها شبك جامعة تيراداتا (انظر: 
(teradatauniversitynetwork.com‏ وتنقسم بوابة شبكة indo‏ تيراداتا إلى قسمين رئيسين: أحدهما 
للطلاب, والآخر لهيئة التدريس. وهذا Basyo GLSI‏ ببوابة شبكة جامعة تيراداتا عبر قسم خاص في 
نهاية JS‏ فصل. piang‏ هذا القسمٌ روابط cas‏ للفصل المحَدّد. eius‏ إلى الموارد ذات الضّلة. كما 
ex;‏ تدريبًا lae‏ باستخدام البرمجيات وغيرها من المواد (كالحالات) المتاحة في شبكة جامعة تيراداتا. 


موقع الكتاب على الإنترنت: 

موقع هذا الكتاب على الإنترنت هو: «pearsonhighered.com/sharda‏ ويحتوي على نص 
إضاف تكميلي منظم كفصول ويب تتوافق مع فصول الكتاب المطبوع. ويتمٌ سَرْدِ مواضيع هذه 
الفصول في جدول محتويات الفصل عبر الإنترنت. 

وَيُرجَى ملاحظة أنه في أثناء مثول هذا الكتاب للطباعة؛ تحققنا من أن جميع مواقع الويب 
التي تمّ الاستشهادُ بها كانت his‏ وصالحة. isl deg‏ حال؛ تكون عناوين URL‏ ديناميكية. 
كما تتغيرٌ أحيانًا مواقع الويب التي نشيرُ إليها في النص أو تتوقف بسبب تغيير الشركات لأسمائها 
أو شرائها أو بيعها أو دمجها أو تعطلها. وفي بعض الأحيان تكون مواقع الويب تحت الصيانة أو 
الإصلاح أو إعادة التصميم. وقد أسقطت العديدٌُ من المؤسسات البادئة "Www"‏ من مواقعها؛ 
ولكن البعض الآخر لا يزال يستخدمها. وإذا واجهتك أي مشكلة في الاتصال بموقع الويب الذي 
نذكره؛ dosl cég‏ بالصبر وببساطة قم بعمل بحث على الويب؟ لمحاولة تحديد الموقع الجديد 
المحتمّل. والذي في الغالب سيمكنك العثور عليه بسرعة من خلال أحد محركات البحث الشائعة. 
ولا يسعنا إلا أن نعتذر مقدمًا عن هذا الإزعاج. 
تلخيص لأهم نقاط الفصل: 
- أصبحت بيئة الأعمال SÍ‏ تعقيدًا وتتغير بسرعة؛ مما يجعل اتخاذ القرار أكثر صعوبةً. 
- يجب أن تستجيب CEAI‏ وتتكيف مع بيئة التغيير بسرعة عن طريق اتخاذ قرارات أسرع وأفضل. 
- إن الإطار الرّمني لاتخاذ القرارات يتقلّصء في حين أن الطبيعة العالمية لصُنع القرار آخذة في 

التوسع؛ مما يستلزم تطوير واستخدام نظم إدارة أمن البيانات "Acus‏ 
- تستخدم أنظمةٌ دعم القرار البيانات والنماذج وأحيانًا إدارة المعرفة لإيجاد حلول للمشكلات 
شبه المهيكلة وبعض المشكلات غير الهيكلية. 
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- تستخدم طرق ذكاء الأعمال مستودعًا مركزيًا GAS‏ مستودع البيانات والذي هكن من التنقيب 
في البيانات بكفاءة وتصوير البيانات. 

- وتشمل بنيةٌ ذكاء الأعمال مستودعات البيانات وأدوات تحليل الأعمال ا ممستخدّمة من قبل 
المستخدمين النهائيين وواجهة المستخدم (مثل لوحات اللعلومات). 

- تستخدم doas‏ من المنظمات التحليلات الوصفية لتحلّ محل تقاريرها التقليدية المُسطّحة مع 

التقارير التفاعلية التي تقدَّم رؤى واتجاهات وأنماط في بيانات المعاملات. 

o S‏ التحليلاث التنبؤية المؤسسات من وَضْع قواعد تنبؤية تُشجّع نتائج الأعمال من خلال 

تحليل البيانات التاريخي للسلوك الحالي للعملاء. 

- تساعد التحليلاتٌ التوجيهية في بناء النماذج التي تنطوي على أساليب التنبؤ والأمثلية على أساس 

مبادئ تقارير التشغيل ees‏ الإدارة؛ لمساعدة المنظمات على اتخاذ قرارات أفضل. 

يركز تحليل البيانات الضخمة على مجموعات البيانات الكبيرة غير المهيكلة» والتى 

قد تتضمّن أيضاً أنواعًا مختلفةٌ تمامًا من البيانات للتحليل. ١‏ 

- تُعرف التحليلات كمجال بأسماء التطبيقات الخاصة بالصناعة, مثل التحليلات الرياضيةء وهو 
معروف أيضاً بأسماء أخرى ذات els Jis do‏ البيانات أو علم الشبكة. 

- إِنَّ الرُعاية الصحية وسلاسل بيع التجزئة؛ هما مجالان تكثر فيهما تطبيقات التحليلات والكثير 
من المجالات قادمة. 

- هكن النظرٌ إلى النظام البيئي للتحليل لأول مرة على أنه مجموعةٌ من مُقدَّمِي الخدمة 
وا مستخدمين والميسرين. يمكن تقسيمها إلى ١١‏ مجموعةٌ. 


مصطلحات أساسية: 





التحليلات الوصفية 


التحليلات à‏ ا معلومات 
pas‏ وج اللعلومات (أو إعداد التقارير) 





معالجة امعاملات الفورية (OLTP)‏ النظام البيئي للتحليلات |التنقيب في البيانات 























تحليلات البيانات الضخمة القرار أو التحليلات المعيارية | وكلاء الذكاء 
التحليلات التنبؤية ذكاء الأعمال (81) المعالجة التحليلية الفورية (OLAP)‏ 
التحليلات التوجيهية خدمات الويب 
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أسئلة للمناقشة: 

-١‏ قم بإجراء ea‏ الدراسات منذ الأشهر الستة الماضية؛ للعثور على تطبيق واحد JS)‏ من نُظم 
دعم القرار DSS‏ وذكاء الأعمال والتحليلات. ولخّص التطبيقات في صفحة واحدة وأرسلها 
مع عرض دقيق. 

-Y‏ ميّز بين ذكاء الأعمال ونظام دَعْم القرار. 

-Y‏ قارن وميّز بين التحليلات التنبؤية والتحليلات الوصفية والتحليلات التوجيهية. استخدم الأمثلة. 

-٤‏ ناقش المشكلات الرئيسة في تطبيق ذكاء الأعمال. 


تمارين شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 


-١‏ اذهب إلى .teradatauniversitynetwork.com‏ وباستخدام كلمة مرور الموقع التي يقدّمها 
معلمك» قم بالتسجيل في الموقع إذا لم تكن قد قمتّ بالتسجيل مسبقًا. قم بتسجيل الدخول 
وتعرّف على محتوى الموقع. سوف تتلقى المهمات المتعلقة بهذا الموقع. قم slach‏ قانمة تضم 
٠‏ عنصرًا على الموقع تعتقد أنها قد تكون مفيدةً لك. 

-Y‏ اذهب إلى موقع شبكة جامعة تيراداتا. استكشف صفحة Sports Analytics‏ وقم بتلخيص 
اثنين على الأقل من تطبيقات التحليلات في أيّ رياضة من اختيارك. 

-Y‏ ادخل إلى موقع شبكة جامعة تيراداتا. وحَدَّد «الحالات وا مشاريع والواجبات». ثم اختر دراسة 
الحالة «Harrahs High Payoff from Customer Information»‏ أجب عن الأسئلة 
التالية حول هذه القضية: 

-١‏ ما هي المعلومات التي تنتج عن التنقيب في البيانات؟ 

CÉS كيف تكون هذه المعلومات مفيدةٌ للإدارة في صُنع القرار؟ (كن‎ -Y 
اذكر أنواع البيانات التي يتم التنقيب فيها.‎ -Y 

€- هل هذا تطبيق DSS‏ أو SBI‏ وبلاذا؟ 

€- اذهب إلى «teradatauniversitynetwork.com‏ وقم بإيجاد الورقة بعنوان «مستودعات 
البيانات يدعم إستاتيجية الشركة في أول شركة أمريكية» ش (بواسطة Watson‏ 
((Goodhues Wixoms‏ اقرأ الورقة» وأجب عن الأسئلة التالية: 





-١‏ ما هي دوافع مشروع مستودع البيانات / ذكاء الأعمال في الشركة؟ 
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-Y‏ ما هي المزايا الإستراتيجية التي تحققت؟ 
*- ما هي المزايا التشغيلية والتكتيكية التي تحققت؟ 
-E‏ ما هي عوامل النجاح الحسّاسة بالنسبة للتنفيذ؟ 

-o‏ انتقل إلى http://analytics-magazine.org/issues/digital-editions‏ وقم بإيجاد 
إصدار يناير / فبراير ١٠١۲م‏ بعنوان «مشكلة خاصة: مستقبل الرعاية الصحية». 
اقرأ «التحليلات التنبؤية - إنقاذ الأرواح وخفض الفواتير الطبية». أجب عن الأسئلة التالية: 

-١‏ ما هي المشكلة التي يتم تناولها من خلال تطبيق التحليلات التنبؤية؟ 

3FICO ما هي درجة الالتزام بأدوية‎ -Y 

-Y‏ كيف يتم Ca all‏ على نموذج التنبؤ بأدوية SFICO‏ وهل Ao‏ نموذج التنبؤ درجة 
التزام الدواء في SFICO‏ 

-E‏ قم بتكبير الشكل ٤‏ واشرح Gl‏ نوع من الأساليب يتم تطبيقه على النتائج المتولدة. 

0- اذكر بعض القرارات القابلة للتطبيق التي تمّ استخدامها بناءً على نتائج التنبق. 

1- انتقل إلى .http://analytics-magazine.org/issues/digital-editions‏ وقم بإيجاد 
إصدار يناير/ فبراير ۲١٠١‏ «العمل الاجتماعي». واقرأ WALI‏ «البيانات الضخمة والتحليلات 
والانتخابات». وأجب عن الأسئلة التالية: 

-١‏ ما هي أنواع البيانات الضخمة التي 3& تحليلها في المقالة gle 3Coo‏ على بعض مصادر 
البيانات الضخمة. 

-Y‏ اشرح مصطلح النظام المتكامل. وما هو المصطلح الفني الآخر الذي يتناسب مع النظام ا متكامل؟ 
-Y‏ ما هي أنواع أساليب تحليل البيانات المُستخدّمة في المشروع؟ ge‏ على بعض المبادرات 
التي نتجت عن تحليل البيانات. 

-E‏ ما هي مشكلات التنبؤ المختلفة التي lado‏ النماذج؟ 

0- اذكر بعض القرارات القابلة للتطبيق التي تم اتخاذها والتي aas‏ إلى نتائج التنبؤ. 

1- حَدّد تطبيقين لتحليلات البيانات الضخمة غير المُدرّجة في المقالة. 

-V‏ ابحث في الإنترنت عن altl‏ المتعلّقة بعمل المديرين ويلعب دور تحليلات. ما هي أنواع 
المصادر للشركات الاستشارية والأقسام الأكادهية والبرامج التي تجدها؟ ما هي المجالات 
الرئيسة التي تمّ إعادة تصميمها؟ S35‏ خمسة مواقع تغطي مجالاً واحداً. قدّم نتائجك. 
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۸- استكشف المناطق العامة من .dssresources.com‏ قم بإعداد قائمة بالموارد المتاحة الرئيسة. 
قد ترغب في الرجوع إلى هذا الموقع في أثناء عملك من خلال الكتاب. 

4- اذهب إلى .microstrategy.com‏ قم بإيجاد معلومات عن الأنماط الخمسة من ذكاء الأعمال» 
قم بإعداد جدولٍ ملخص JS‏ نمط. 

-٠‏ انتقل إلى coracle.com‏ وانقر على Hyperion Jal;‏ ضمن التطبيقات. Sd‏ ما هی منتجات 
الشركة الرئيسة. اربطها بتقنيات الدعم المذكورة في هذا الفصل. ١‏ 

-١‏ انتقل إلى موقع أسئلة شبكة جامعة تيراداتا. ابحث عن مقاطع فيديو 851. راجع مقطع 
الفيديو الخاص ب .«Case of Retail Tweeters»‏ ثم قم بإعداد vasa‏ مكوّن من صفحة 
واحدة للمشكلة والحل المقترّح والنتائج التي تمّ تقدهها. وهكنك أيضاً العثور على الشرائح 
المقترنة على „slideshare.net‏ 

-YY‏ قم بمراجعة قسم النظام البيئي لبرنامج التحليلات. ahg‏ ما لا يقل عن شركتين إضافيتين 
فيما لا يقل عن خمس مجموعات من الصناعات المذكورة في المناقشة. 

-W'‏ شملت المناقشةٌ المتعلقة بالنظام البيئي التحليلي أيضاً العديد من عناوين الوظائف النموذجية 
لخريجي برامج تحليل وعلم البيانات. ابحث عن مواقع الويب مثل datasciencecentral.‏ 
tdwi.orgs com‏ لتحديد مالا يقل عن ثلاثة عناوين وظيفية مشابهة أخرى قد تجدها 
مشوقةً في حياتك المهنية. 
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التحليلات الوصفية (V)‏ 
طبيعة البيانات, النمذجة الإحصائيةء تصوير البيانات 


أهداف التعلّم: 
- فهم طبيعة البيانات من حيث صلتها بذكاء الأعمال والتحليلات. 
ls -‏ الطرق المُستخدّمة لتجهيز تحليلات البيانات الواقعية. 
- وَضْف النمذجة الإحصائية وعلاقتها بتحليلات الأعمال. 
- تعلّم الإحصاء الوصفي والاستدلالي. 
- تعريف تقارير الأعمالء وفهم تطؤرها التاريخي. 
- فهم أهمية تصوير البيانات/ المعلومات. 
elus -‏ أنواع مختلفة من تقنيات التصوير البياني. 
- تقدير القيمة التي تضيفها التحليلاث المرئية إلى تحليلات الأعمال. 
- معرفة قدرات وقيود لوحات المعلومات. 

في عصر البيانات الضخمة وتحليلات الأعمال التى نعيش فيها؛ لا هكن إنكار أهمية البيانات. 
وهناك عبارات مُستحدَثة مثل: «البيانات هي النفط» «البيانات هي اللحم الجديد» «البيانات 
هى العملة الجديدة»» و«البيانات هى الملك»» هذه العبارات من شأنها أن تزيدَ من أهمية البيانات 
من جديد. ولكن عن أي نوع من البيانات نتحدث؟ من الواضح Y lol‏ نتحدث عن Gl‏ بيانات. 
jl‏ مفهوم / مبدأ المدخلات السيئة ينتج aie‏ مخرجات سيئة “garbage in garbage out-GIGO"‏ 
ينطبق على ظاهرة «البيانات الضخمة» في الوقت الحالي أكثر من Gi‏ بيانات في isl‏ وقت سابق. ولكي 
تتمكّن lll‏ من الوفاء بوعدها وقيمة اقتراحها وقدرتها على التحول إلى رؤية واقعية؛ فلا بد من 
الاعتناء بإنشائها/ تحديدهاء وكذلك جمعها وتكاملها وتنظيفها وتحويلها ووضعها بصورة صحيحة 
في السياق المناسب لاستخدامها في اتخاذ القرارات بدقة وفي الوقت المناسب. 

asd‏ البياناث الموضوعً الرئيس لهذا الفصل. ووفقًا لذلك؛ يبدأ الفصل Abg‏ لطبيعة البيانات: 
ماهية البيانات؟ وما هي الأنواع والصور المختلفة التي يمكن أن تظهر بها البيانات؟ وكيف 
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يمكن معالجتها مسبقًا وتجهيزها للتحليلات؟ يتم تخصيصٌ الأجزاء القليلة الأولى من الفصل 
لفهم ومعالجة البيانات بشكلٍ عميق وضروري. كما تقوم أجزاءٌ قليلة بعد ذلك ibg‏ الطرق 
الإحصائية المُستخدّمة لتحضير البيانات كمدخلات لإنتاج JS‏ من المقاييس الوصفية والاستدلالية. 
ثم يلي الأجزاء الإحصائية gles tl ol‏ بالتقارير وتصوير البيانات. ig‏ التقريرٌ Bol‏ اتصال 
تم إعدادُها لغرض dod‏ وهو تحويل البيانات إلى معلومات ومعرفة وترحيل تلك ا معلومات 
بتنسيق قابل للفهم/ الاستيعاب. في الوقت الحالي» يتم الاهتمام أكثر بتوجيه هذه التقارير 
بصورة die‏ وغالبًا ما ess‏ ذلك باستخدام الألوان والرسوم البيانيةء والتي تبدو بشكل عام 
كلوحة معلومات الغرض منها iuas‏ محتوى تلك المعلومات. وبالتالي؛ تمّ تخصيصٌ الجزء الأخير 
من الفصل للأقسام الفرعية التي cuis‏ بعرض التصميم والتنفيذ. وكذلك الطريقة المثلى لتصوير 
المعلومات والشرح التفصيلي وعرض لوحات تلك ا معلومات. 

V-Y‏ مقال افتتاحي: قيام SiriusXM Jl‏ بجذب وإشراك جيل جديدٍ من 
مستخدمي الراديو باستخدام التسويق المبني على البيانات: 

xd‏ المحطةٌ الإذاعية الفضائية 5S SiriusXM‏ شركة إذاعية في العام؛ إذ تُحقق عائدات 
سنوية تبلغ ۲۸ مليار دولارء وتقوم Can‏ مجموعة واسعة من الموسيقى الشعبية والرياضة 
والأخبار والحديث وفقرات الترفيه. وقد بدأت الث في عام ۲١١١‏ بعدد 0٠٠٠0‏ مشتركء إلى أن 
وصلت إلى VAA‏ مليون مشترك في عام ۲۰۰۹ واليوم لديها ما يقربُ من YA‏ مليون مشترك 

يرجع الجزءٌ 5M‏ من النموٌ الذي حققته شركة SiriusXM‏ حتى الآن إلى الترتيبات الإبداعية 
مع شركات تصنيع السيارات. واليوم تم تمكين ما يقارب من X Ve‏ من السيارات الجديدة من 
شركة SiriusXM‏ ومع ذلك؟ فقد امتدّ أثرٌ الشركة ما هو أبعد من أجهزة الراديو في الولايات 
المتحدة ألا وهو التواجدٌُ العالمي على الإنترنت والهواتف الذكية وأيضًا التواجد من خلال خدمات 
وقنوات توزيع أخرى le‏ في ذلك -Dishs JetBlueg SONOS‏ 
Xs‏ الأعمال: 

على الرّغم من هذه النجاحات الرائعة؛ فإنه في غضون السنوات القليلة الماضية fois‏ 
للتغ cli‏ التى طرأت على d$‏ من التركيبة السكانية للعملاء والتقنية. Lar‏ حصة المنافسين 
من السوق؛ فقد أَدّى ذلك كله إلى ظهور سلسلة جديدة من تحَدّيات الأعمال والفرص التجارية 
لشركة SSiriusXM‏ ونعرض فيما يلي بعضاً من أبرز تلك التحديات والفرص: 
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التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


- مع زيادة مُعدَّل انتشار السيارات الجديدة في السوق؛ فقد تغيّرت التركيبةٌ السكانية للمشترين؛ 
فقد أصبحت أصغر di a‏ مع دخل تقديري أقل. كيف يكن هنا أن تتعرف شركة SiriusXM‏ 
على هذه التركيبة السكانية الجديدة؟ 

- مع استعمال السيارات الجديدة ومن ثم بيعها كسيارات مستعملة SIU‏ جُدد» كيف يمكن هنا 
ل SiriusXM‏ أن a455‏ هؤلاء المالكين coded!‏ وتحوّلهم إلى عملاء مباشرين؟ 

cia -‏ شركة SiriusXM‏ من تقديم خدماتها عبر JS‏ من الأقمار الصناعية والشبكات اللاسلكية؛ 
وذلك بعد استحواذها على أعمال OLSA‏ المترابطة من شركة Agero‏ - والتي تُعتبر الشركة 
الرائدة في مجال تقنيات المعلومات في سوق السيارات بالولايات المتحدة الأمريكية - فكيف 
يمكنها استغلال هذه الصفقة بنجاح للحصول على مصادرجديدة للدخل؟ 


d‏ المُقترّح: تحويل الرؤية نحو التسويق المستند إلى البيانات: 
اعترفت شركة SiriusXM‏ أنه لواجهة OI OLAS ola‏ عليها أن تصبح منظمة تسويق عالية 
الأداء ومستندةٌ على البيانات. بدأت الشركة في إجراء هذا التحؤّل من خلال إنشاء ثلاثة مبادئ أساسية: 
- أولًا: التفاعلات الشخصية - وليس التسويق الجماعي - من شأنها أن تحكم اليوم. وسرعان ما 
فهمت الشركة أنه لإجراء ا مزيد من التسويق الشخصي؛ فعليها الاعتماد على التاريخ والتفاعلات 
السابقة. وكذلك على الفهم الشديد لموقع المستهلك من دورة حياة الاشتراك. 
WË -‏ للوصول إلى هذا القدر من الفهم؛ ستحتاج تقنية المعلومات وشركاؤها في التقنية الخارجية 
إلى القدرة على تقديم بيانات متكاملة. وتحليلات متقدّمةء ومنصات تسويق متكاملة. وأنظمة 
توصيل مُتعدّدة القنوات. 
- 5 قد لا تتمَكّن الشركة من تحقيق أهدافها التجارية دون وجود وجهة نظر متكاملة ومتسقة 
بهاء والأهم من ذلك؛ يجب أن تتحول الجوانب التقنية والتجارية في SiriusXM‏ إلى شركاء حقيقيين 
lax‏ على نحو أفضل للتحديات التي تواجهها في أن تصبح منظمة تسويقيةً عالية cll‏ ومعتمدةٌ 
على الأفكار المستندة على البيانات Coal‏ مباشرةً مع المستهلكين بطرق ملائمة بشكلٍ ملحوظ. 
تلك الأفكارٌ المبنية على البيانات» على سبيل ال مثال» سثّمكن الشركة من التفريق بين ا لمستهلكين 
واخلاك والسائقين والمستمعين وأصحاب الحسابات. كما ستساعدٌ هذه الأفكار شركة SiriusXM‏ 
على فهم تلك المركبات والخدمات الأخرى التي تُشكّل جزءًا من jS‏ أسرة, gio lég‏ فرص جديدة 
للمشاركة. بالإضافة إلى EUS‏ ومن خلال إنشاء رؤية شاملة وموثوقة بزاوية YT‏ درجة لجميع 
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مستهلكيهاء تستطيع SiriusXM‏ ضمان أن تكون جميع الرسائل في جميع الحملات والتفاعلات 
d Aa‏ وملاهمةً ومتسقةٌ عبر جميع القنوات. والنقطة المهمة أيضًا هي أن يكون التسويقٌ 
الأفضل تصميمًا وفعاليةً هو عادةً الأقل تكلفة. 
التنفيذ: إنشاء ومتابعة المسار المؤدي إلى التسويق عالي الأداء: 
في الوقت الذي قرّرت فيه أن تصبح 45,5 تسويق عاليةً الأداء؛ كانت SiriusXM‏ تعمل مع منصة 
تسويق خارجية لا تمتلك القدرة على دعم طموحات SSiriusXM‏ فاتخذت الشركة قرارًا مستقبليًا مهما 
يهدف إلى رفع قدراتها التسويقية الداخليةء ومن ثم رسمت بعناية ما يلزم ELI‏ به لتحقيق ذلك بنجاح. 
-١‏ تحسين نظافة البيانات من خلال تحسين إدارة البيانات الرئيسية والحوكمة. وعلى الرغم 
من نفاد صبر الشركة في mas‏ الأفكار موضع التنفيذ؛ Of‏ نظافة البيانات كانت dsl ghò‏ 
وضروريةً لإنشاء نافذة موثوقة في سلوك المستهلكين. 
-Y‏ نقل نشاط التحليلات التسويقية إلى داخل الشركة وتوسيع حجم البيانات؛ لرفع كفاءة تلك 
التحليلات وتقديم دعم كاملٍ ومتكامل لها. 
-Y‏ تطوير نماذج جديدة للتصنيف والتسجيل لتفعيل قاعدة البيانات» والقضاء على التأخر في 
الاستجابة وتكرار البيانات. 
> توسيع حجم البيانات المتكاملة لتشمل بيانات التسويق والتسجيل؛ والاستفادة من تحليلات قاعدة البيانات. 
0- اعتماد منصة تسويقية لتطوير الحملات. 
-1١‏ وَضْع JS‏ تلك القدرات tia‏ لتحقيق إدارة العروض في وقتٍ ملائم عبر جميع قنوات التسويق: 
مركز الاتصالء والتليفونات الخلويةء ومواقع الإنترنت» والتطبيقات الجاهزة. 
ól‏ إكمال ÍS‏ تلك الخطوات يعني العثور على شريك التقنية المناسب. فوقع اختيار 
SiriusXM‏ على تيراداتا؛ إذ شكّلت bla‏ قوتها dad)‏ قويةٌ بين ا مشروع والشركة؛ فكانت تيراداتا 
byob‏ على القيام ها يلي: 
qas -‏ مصادر البيانات مع مستودع obla‏ متكامل (IDW)‏ وتحليلات متقدمةء وتطبيقات تسويق قوية. 
de -‏ المشكلات وقت استجابة البيانات. 
- تقليص معنوي في حركة البيانات عبر قواعد بيانات وتطبيقات مُتعدّدة. 
- سلاسة التفاعل مع التطبيقات الجاهزة والوحدات النمطية لجميع مجالات التسويق. 
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- القياس والتنفيذ بمستويات عالية جدًا؛ بهدف تشغيل الحملات والتحليلات ضمن قاعدة البيانات. 
- فتح قنوات اتصال في وقت ملائم مع العملاء. 
- تقديم الذّعم التشغيلي (سواءً عبر السّحابة أو في أماكن العمل). 

وقد Lia‏ شركة تيراداتا شركة SiriusXM‏ من التحرك بسلاسة وبسرعة على امتداد خارطة 
الطريق التي رسمتها لنفسهاء والشركة الآن في خضم عملية تحؤلية مدتها خمس سنوات. وبعد 
تأسيسها لعملية إدارة البيانات القويةء بدأت SiriusXM‏ من خلال تنفيذ مستودع بيانات متكاملة 
لهاء والذي مكّن الشركة بسرعة وبطريقة فعّالة في تفعيل رؤيتها الجديدة في جميع أنحاء المنظمة. 

قامت الشركة بعد ذلك بتنفيذ ما GÀ ud‏ ”مدير التفاعل مع العملاء“ - وهو جزءٌ من برنامج 
تيراداتا Integrated Marketing Cloud‏ - الذي يتيخ التفاعل حواري مع العميل في الوقت 
الملائم؛ وذلك عبر مجموعة كاملة من قنوات الاتصال الرقمية والتقليديةء وأيضًا يسمح بالتعاون 
بين SiriusXM‏ ومركز الرسائل الرقمية ل تيراداتا. 

وستتيح تلك الحزمة من الإمكانيات المجتمعة لشركة Jakei SiriusXM‏ مع الاتصالات 
المباشرة عبر قنوات مُتعددة. كما أن هذا التطؤر سوف يتيخ العروض في الوقت الملائم» وكذلك 
الرسائل التسويقية والتوصيات £l‏ على السلوك السابق. 

وبالإضافة إلى تبسيطها LAS LAS‏ وتحسين الأنشطة التسويقية الصادرة؛ تتحكّم SiriusXM‏ أيضًا 
في عمليات التسويق الداخلية الخاصة بها بالتنسيق مع إدارة الموارد التسويقية, والذي أيضًا ad‏ جزءًا 
من تيراداتا Integrated Marketing Cloud‏ وسيسمح هذا NT‏ لشركة SiriusXM‏ بتبسيط سير 
العمل» وتحسين الموارد التسويقيةء ورفع الكفاءة من خلال S‏ قرش من ميزانية التسويق الخاصة بهم. 
النتائج: حَصد الفوائد: 

بينما الشركة تواصل تطورها لتصبح aliio‏ تسويقيةً عالية الأداء؛ إذ SiriusXM‏ تستفيدٌ بالفعل 
من إستراتيجيتها المنقّذة بعناية. تعمل JS‏ من إحصاءات المستهلك على مستوى الأسرة والرؤية 
الكاملة لإستراتيجية اللمس التسويقية مع US‏ مستهلك على تمكين SiriusXM‏ من إنشاء عروض 
أكثر استهداقًا على مستوى US‏ من الأسرة والمستهلكين والأجهزة. ومن خلال جعل قدرات البيانات 
والتحليلات التسويقية من ضمن أنشطة الشركة الداخلية تمكّنت SiriusXM‏ من تحقيق dI‏ 
- الحصول على نتائج الحملة فورًا تقريبًا Sou‏ من > أيام؛ مما يودي إلى تخفيضات هائلة في Js‏ 

الدوران الزمني للحملات والمحلّلِين الداعمين لها. 
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- الحصول على رؤية دائرية مُغلقة تسمح glaat‏ بدعم الحوارات المتعددة المراحل وإجراء 
تعديلات داخل الحملة لزيادة فعاليتها. 
- الحصول على نمذجة وتسجيلٍ فوري؛ لرفع مستوى الذكاء التسويقي Jis‏ عروض الحملات 
والاستجابات بسرعة تلائم أنشطة الشركة التجارية. 
وأخيرًاء eje‏ تجربة SiriusXM‏ فكرة أنَّ التسويق العالي الأداء A3‏ مفهوماً يتطور باستمرار. 
كما قامت الشركة بتنفيذ US‏ من العمليات والتقنية التي تمنحها القدرة على النموٌ المستمرٌ والمرن. 
أسئلة على المقالة الافتتاحية: 
la -١‏ تفعل isl ds TSiriusXM‏ نوع من السوق تقوم بأعمالها؟ 
-Y‏ ما التحَدّيات التي واجهتها؟ مع التعليق على S‏ من التقنية والتحَدّيات المتعلقة بالبيانات. 
-Y‏ ما الحلول القترحة؟ 
-E‏ كيف قامت الشركة بتنفيذ الحلول المقترحة؟ وهل واجهوا (Sl‏ تحديات في أثناء التنفيذ؟ 
0- ماذا كانت النتائج والفوائد؟ وهل كانت تستحقٌ الجهد/ الاستثمار؟ 


-T‏ هل كنك التفكير في شركات أخرى تواجه تَحَدّياتِ مماثلةء ويمكنها الاستفادة من الحلول 
التسويقية المشابهة القائمة على البيانات؟ 


ماذا يمكننا أن pls‏ من هذه المقالة القصيرة؟ 

في سعيها إلى النجاح ضمن بيئة صناعة تنافسية سريعة sgl‏ أدركت SiriusXM‏ الحاجة 
إلى بنية تحتية تسويقية جديدة ومُطورة (والتي تستندٌ إلى البيانات والتحليلات)؛ وذلك لتوصيل 
القيمة ابمقترحة بفعالية لعملائها الحاليين والمحتملين. وكما هو الحال في delio (S‏ أو في الترفيه؛ 
يعتمد النجاح أو البقاء طويلًا على استشعار النزعات المتغيرة (التفضيلات وعدم التفضيلات) 
بذكاء le‏ ووضع الرّسائل الصحيحة والسياسات المناسبة tle‏ بهدف كسب Mas‏ جُدد مع 
الإبقاء على العملاء الحاليين. الغرض هنا؛ هو إنشاء وإدارة الحملات التسويقية الناجحة التي 
يتردد صداها مع السكان المُسِتَهدَفين من العملاء الذين يعكسون حُزمة من ردود الأفعال وثيقة 
d Lal‏ تهدف إلى ضبط وتعديل الرسالة من أجل تحسين المخرجات. في النهاية؛ كان الأمرٌ 
يتعلق CIS‏ بدقة الطريقة التي 65 اتباعها في الأنشطة التجاريةء وهي أن تكون BEL.‏ بشأن 
الطبيعة المتغيرة للعملاءء وأيضًا توفير المنتجات والخدمات المطلوبة في الوقت المناسب للعميل؛ 
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وذلك باستخدام كاملٍ لإستراتيجية التسويق القائمة/ المعتمدة على البيانات. وقد لعب d$‏ من 
تحديد وإنشاء المصادر والوصول إليها وجمعهاء وتكاملها وتنظيفها وتحويلها وتخزينها ومعالجتها 
للبيانات محل الدراسة دورًا مهمًا في نجاح SiriusXM‏ في تصميم وتنفيذ إستراتيجية تحليلية 
تسويقية» كما هو الحال في Gi‏ شركة ناجحة في الوقت الحاضر باس تخدام الذكاء التحليليء بغض 
النظر عن الصناعة التي يشاركون فيها. 


۲-۲ طبيعة البيانات: 

sd‏ البيانات هي العنصر الرئيسي GY‏ مبادرة (ذكاء أعمال)» وعلم البيانات» وتحليلات الأعمال. 
في الواقع؛ يمكن اعتبارٌ البيانات أنها المادة الخام لما تنتجه هذه التقنيات الشائعة لاتخاذ القرار 
من معلومات ورؤية ومعرفة. وبدون بيانات ما كان GY‏ من هذه التقنيات أن تظهر أو تنتشرء 
وعلى الرغم من أننا قمنا - وبشكلٍ تقليدي - ببناء نماذج تحليلية باستخدام JS‏ من معرفة وخبرة 
الخبراء ببيانات قليلة جدًا أو بدون بيانات على الإطلاق» على JS‏ حال كان ذلك في السابق أا الآن 
فقد أصبحت البيانات )$55 أساسيةً في US‏ ذلك. ونظراً لكون جَمْع وتخزين وإدارة البيانات من 
أكبر التحَدّيات؛ فإنها da‏ (أيْ: البيانات) ضمن أغلى وأتمن أصول (sl‏ منظمة. مع إمكانية إنشاء 
رؤية لا تُقدّر بثمن لفهم العملاء وا منافسين وعمليات الأعمال بشكل أفضل. 
يمكن أن تكون البيانات aio‏ ويمكن أن تكون Ke bS‏ ومن الممكن أن تكون البيانات 
lS.‏ (مُعدَّة بصورة جيدة للتعامل مع أجهزة الحاسب)ء أو يمكن أن تكون غير مهيكلة (على 
سبيل المثال: يتم tlis)‏ نص 6545« وبالتالي لا يمكن فهمه/ التعامل معه بواسطة أجهزة الحاسب). 
ومن الممكن أن تأتي البيانات Glo‏ في مجموعاتٍ صغيرة أو تتقولب دفعة واحدة في مجموعة 
أكبر. هناك بعضٌ الخصائص التي تُحدّد الطبيعة المتأصلة للبيانات OII‏ والتي نسميها في الغالب 
البيانات الضخمة أو الكبيرة الحجم. وعلى الرغم من أن هذه الخصائص للبيانات تجعلها أكثرٌ 
rgo‏ في ا معالجة والاستخدام؛ فإنها تزيدُ من قيمتها؛ لأنها تجعلها أكثر 2,3 للدراسة بعيدًا 
عن مفاهيمها المألوفة؛ مما يسمح باكتشاف معرفة جديدة ومبتكرة. لقد انقضى às)‏ الطرق 


0 


s 


Sources: Quinn, C. (2016). Data-driven marketing at SiriusXM. Teradata Articles & News. at http://bigdata. 
teradata.com/US/Articles-News/Data-Driven-Marketing-At-SiriusXM/(accessed August 2016); Teradata 
customer success story. SiriusXM attracts and engages a new generation of radio consumers. http://assets. 
teradata.com/resourceCenter/downloads/CaseStudies/EB8597.pdf?processed-1. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري M‏ 


الفصل الثاني 


التقليدية gazd‏ البيانات يدويًا (إمّا عن طريق الاستطلاعات» أو عبر معاملات تجارية مباشرة) 
dors‏ محلّها ČL‏ جديدةٌ لجمع البيانات الحديثة التي تستخدم الإنترنت و/أو أجهزة الاستشعار/ 
REID‏ المعتمدة على الشبكات المحوسبة. إن هذه الأنظمة الآلية لجمع البيانات لا cg‏ فقط 
من جمع مزيد من البيانات؛ ولكن Ll‏ ترفع من جودة OLLI‏ وتؤكّد على سلامتها. Tsa‏ 
الشكل Y-V‏ سلسلة التحليل النموذجية - بيانات إلى تحليلات إلى معلومات قابلة للتنفيذ. 





عملية الأعمال 




















شكل :V-Y‏ بيانات الاستمرارية وال معرفة 

وعلى e‏ من BL‏ الثمينة التي تحتلها البيانات والتي لا يمكن إنكارّها؛ فإنه يجبٌ أن 
&:b‏ البياناتٌ ببعض القياسات الأساسية ذات الجودة والقابلية للاستخدام. ومن ا معلوم أنه 
ليست كل البيانات Sada‏ لجميع المهام؛ إذ coo‏ أن تتطابق البياناث مع المهمة المراد استخدام 
تلك البيانات فيها بجانب تغطية التفاصيل الخاصة بتلك المهمة. وبالنسبة GY‏ مهمة Bolas‏ 
يجبٌ أن تتوافق البيانات المتاحة مع متطلبات الجودة والكمية. وبشكل أساسي؛ لا بد من تجهيز 
البيانات للتحليلات. والسؤال هنا ما هو تجهيز البيانات للتحليلات؟ فبالإضافة إلى ضرورة ملاءمتها 
للمشكلة محل البحث ومتطلبات الجودة/الكمية؛ يجب أن يكون للبيانات هيكل معينُ يتماثى 
مع الحقول/المتغيرات الرئيسة مع القيم الطبيعية الصحيحة. Íe‏ على ذلك؛ يجب أن يكون 
هناك تعريفٌ متفق عليه على مستوى المؤسسة للمتغيرات وا موضوعات الشائعة Duo)‏ نُسمّى 
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Á T‏ إدارة البيانات الرئيسة)» مثل كيفية تعريف العميل la)‏ هي خصائص العملاء ا ممستخدّمة 
لإنتاج تمثيلٍ شامل ها يكفي للتحليلات) وفي GÍ‏ مرحلة من النشاط التجاري يتم الحصولٌ على 
المعلومات المتعلقة بالعميل والتحقّق منها وتخزينها وتحديثها. 
في بعض الأحيان؛ قد يعتمد تمثيل البيانات على نوع التحليلات امس تخدمة. عادةً ما 
تتطلّب الخوارزميات التنبؤية بشكلٍ عام وجود ملف Ca‏ مع متغير مُستَهدف؛ لذا BIB‏ 
تجهيز تحليلات البيانات للتنبؤ؛ يعني yg p‏ تنسيق مجموعات البيانات على هيئة ملف 
مُسطح مع تجهيزها للدخول في تلك الخوارزميات التنبؤية. كما أنه من الضروري أيضًا مطابقة 
البيانات مع متطلبات برمجيات خوارزمية التنبؤ - على سبيل المثال: c dass‏ خوارزميات 
الشبكة العصبية التمثيل العددي لكل المتغيرات aliat‏ (حتى I‏ ا متغيرات الاسمية تحتاج 
إلى تحويلها إلى متغيرات ثنائية رقمية زائفة؛ في حين لا تتطلّب خوارزميات شجرة القرار 
Jio‏ هذا التحويل الرقمي)» والتعامل بسهولة مع مزيج من المتغيرات الاسمية والرقمية. 
غالبا ما صل iles pa‏ التحليلات التي تتجاهل المهام المتعلقة بالبيانات إلى إجاباتٍ غير 
ملائمة للمشكلة محل البحث» وقد تؤدي هذه الإجابات التي تم الوصولٌ إليها عن غير قصدء 
والتي قد تبدو use‏ إلى اتخاذ قرارات غير دقيقة وغير ملائمة. ونعرضٌ فيما يلي بعض الخصائص 
(المقاييس) التى 3453 مستوى جاهزية البيانات لإجراء دراسة تحليلية Delen: 2015. Kock)‏ 
(Corner. 19975 McQueens‏ 
- موثوقية مصدر البيانات: يشير إلى Ilol‏ وملاءمة وسيط التخزين الذي يتم الحصول على 
البيانات من خلاله - والسؤال هنا هو ”هل لدينا ثقةٌ dab‏ في مصدر البيانات هذا؟ إذا كان 
ذلك ممكنًا؛ فيجبٌ علينا Glo‏ أن نبحث عن امصدر الأصلي/المنشأ الأصلي لتلك البيانات؛ وذلك 
بهدف إزالة/ تقليل احتمال تشويه البيانات وتحويل البيانات الناتجة عن سوء ا معالجة في 
أثناء نقل البيانات من مصدرها إلى وجهتها التالية على مرحلة واحدة أو أكثر؛ إذ إن ejes ÍS‏ 
للبيانات يعطي Ío‏ لإسقاط أو إعادة صياغة بنود تلك البيانات عن غير قصد؛ مما Jod‏ من 
سلامة مجموعة البيانات وربما دقتها الحقيقية. 
dia -‏ محتوى البيانات: يعني ol‏ البيانات صحيحةٌ ومطابقةٌ بشكل جيد لمشكلة التحليلات - وهنا 
dI e‏ آخر ”هل لدينا البيانات الصحيحة للمهمة المطلوبة؟» يجت أن تمثل البياناثٌ اليدف 
الذي تمّ تحديده من خلال المصدر الأصلي للبيانات. فعلى سبيل المثال: يجب أن تكون 
معلوماث التواصل مع العميل المسجّلة في قاعدة البيانات هي نفس ما قاله العميل شخصيًا. 
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هذا وسيتمٌ تناول موضوع d$»‏ البيانات بمزيد من التفصيل في الفقرة التالية من هذا الفصل. 
- إمكانية الوصول إلى البيانات: يعني أن البيانات يمكن الحصول عليها بسهولة is‏ - وذلك بالإجابة 
عن السؤال التالي ”هل هكننا الوصولٌ بسهولة إلى البيانات عندما نحتاج إليها؟“ قد يكون الوصول 
إلى البيانات خادعًا؛ doli‏ إذا كانت مستودعات البيانات في أكثر من موقع ووسط تخزين وتحتاج 
إلى دمج/ تحويل عند الوصول إليها والحصول عليها. ومع تقلّص دور أنظمة إدارة قواعد البيانات 
العلائقية التقليدية (أو تعايشها (ga‏ جيل oder‏ من وسائط مستودعات البيانات» مثل: بحيرات 
البيانات» والبنية التحتية Hadoop‏ تتزايد في نفس الوقت أهمية/ حساسية الوصول للبيانات. 
- حماية وخصوصية البيانات: يعني أنَّ البيانات متاحةٌ فقط لهؤلاء الأشخاص الذين لديهم 
السُلطة والحاجة إلى الوصول إليها gias‏ أيّ شخصٍ آخر من ذلك. إن تزايد الرواج في الدرجات 
التعليمية وبرامج شهادات ضمان اللعلومات؛ هو دليلٌ على الحاجة الماسَّة والمتزايدة ملقياس 
جودة البيانات هذا. ينبغي على (Sl‏ منظمة طبية تحتفظ بسجلات صحية JS)‏ مريض على 
جِدَة؛ أن يكون لديها أنظمة ihh‏ لا تقوم فقط بحماية البيانات من وصول أشخاص غير 
مُصرّح لهم إليها (والذي يتم تفويضه بموجب قوانين اتحادية» مثل قانون قابلية التأمين الصحي 
وقابلية التأمين (HIPPA]‏ ولكنها تُحدّد بدقة السماح وإمكانية الوصول إلى سجلات كل 
مريض من قبل الأشخاص ghabl‏ لهم بذلك )2003 (Annas,‏ 
- ثراء البيانات: يعني أن جميعَ polis‏ البيانات المطلوبة 42595 في مجموعة البيانات. في الأساس؛ 
يعني الثراء sl)‏ الشمولية) أن المتغيّرات المتاحة تُصوّر Tis‏ ثريا ما يكفي لدراسة الموضوع 
الأساسي i oto‏ تحليلية دقيقةٌ Ss‏ ويعني أيضًا Ô‏ محتوى المعلومات مكتملٌ (أو شبه 
مكتمل) لبناء نموذج تحليلات تنبؤية و/أو توجيهية. 
- اتساق البيانات: يعني أن البيانات يتم جمعها بدقة وكذلك دمجها/ تركيبها. وتمثل البيانات 
المتسقة معلومات الأبعاد (متغيرات الاهتمام) الواردة من مصادر متفاوتة الاحتمال ولكنها تتعلق 
بنفس الموضوع. فإذا لم يتم دمج/ تكامل البيانات بشكل صحيح؛ فقد Msi‏ بعص المتغيرات 
الخاصة بموضوعات مختلفة في deus‏ واحد - مع وجود مجموعتين من السّجلات المختلفة للمرضىء 
على سبيل الثال: قد يحدث ذلك في أثناء دمج سجلات بيانات نتائج الفحص السكانية والمرضية. 








- توقيت البيانات: يعني أنَّ البيانات يجب أن يتمّ تحديثها (أو تكون حديثةٌ/ جديدةً كما يجب أن 
تكون) لنموذج التحليلات المعطى. كما يعني أن البيانات يتم تسجيلها في وقت الحدث أو الملاحظة 
أو بالقرب منه؛ بحيث يتم aia‏ التحريف المتعلق بالوقت للبيانات (التذكر والتشفير غير الصحيحين). 
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ونظرًا لأن التحليلات الدقيقة تعتمد على بيانات دقيقة وف الوقت المناسب؛ فإن às JI‏ الأساسية 
للبيانات الجاهزة للتحليلات هي توقيت إنشاء عناصر البيانات والوصول إليها. 

- مستوى تفصيل البيانات: clan:‏ ذلك أن يتم تعريف المتغيرات وقيم البيانات على dol‏ 
مستوى (أو منخفض بقدر الإمكان) من التفاصيل للاستخدام المطلوب للبيانات. فإذا تم 
تجميعٌ البيانات؛ فقد لا تحتوي على مستوى التفاصيل اللازمة لخوارزمية التحليلات بغرض 
loo‏ طريقة تمييز سجلات/ حالات مختلفة بعضها عن بعض. على سبيل المثال: وفي إطار طبّي 
يتحتم تقريبٌ القيم العددية للنتائج المعملية إلى الخانة العشرية المناسبة للتفسير الهادف 
لنتائج الاختبار والاستخدام السليم لتلك القيم داخل خوارزمية التحليلات. وبا مثلء في مجموعة 
البيانات المتعلقة بالتوزيع SIS I‏ ينبغي تعريفٌ عناصر البيانات على مستوّى ملائم لتحديد 
الفروق في نتائج الرعاية بين مختلف المجموعات السكانية الفرعية. شي Šola‏ يجب علينا 
تذكره هنا؛ هو Ol‏ البيانات المُجمّعة لا يمكن تقسيمها (دون الوصول إلى المصدر الأصلي)ء ولكن 
يمكن تجميعها بسهولة من تمثيلها الدقيق. 

- صلاحية البيانات: هو المصطلحٌ المُستخدّم لوصف التطابق/ عدم تطابق بين قيم البيانات 
الفعلية والمتوقعة بلتغير ما. وكجزءٍ من تعريف البيانات؛ يجب تحديدٌ القيم أو نطاق القيم 
المقبولة لكل pais‏ بيانات. على سبيل المثال: يتضمّن تعريف البيانات الصحيح المرتبط بنوع 
الجنسٍ ثلاث قيم: 653 وأنثى» وغير معروف. 

- ملاءمة البيانات: يعني أنَّ ا متغيرات في مجموعة البيانات كلها ذات صلة بالدراسة التي تتم. 
ولا تكد العلاقة مقياسًا GLS‏ التفرُع (كون المتغير مرتبطاً بالدراسة أم dY‏ بل يكون لديها 
مجموعة من الروابط من الأقل صلة إلى الأكثر أهميةً. واستنادًا إلى خوارزميات التحليلات 
cedex all‏ قد يختار الدارس فقط تضمين ابمعلومات الأكثر صلة ssl)‏ ا متغيرات) أو إذا كانت 
الخوارزمية jol‏ على تصنيفها؛ فقد يختارٌ تضمين جميع المتغيرات ذات الصّلة بغض النظر عن 
مستوى ارتباطها. هناك al‏ مهم يجب على دراسات التحليلات ados‏ ألا وهو تضمين بيانات 
غير ملائمة تمامًا في elo‏ النموذج؛ فقد يؤدي ذلك إلى تلويث المعلومات الخاصة بالخوارزمية؛ 
مما يؤدي إلى نتائج غير دقيقة ومُضْلّلة. 

وعلى الرغم من أنَّ هذه المقاييس قد تكون الأكثر شيوعًا؛ DB‏ جودة البيانات الحقيقية 
والاستعداد الممتاز للتحليلات لنطاق تطبيق معين؛ سيتطلبان مستوياتِ مختلفة من التركيز على 
هذه الأبعاد المترية» ورها إضافة المزيد من التفاصيل المّحدّدة لهذه المجموعة. وسوف نتناول 
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في الفصل التالي طبيعة البيانات هزيد من التفاصيل من منظورٍ تصنيفي لسرد أنواع البيانات 
المختلفة وتحديدها من حيث صلتها مشاریع الت التحليلات ايلختلفة. 


أسئلة مراجعة على القسم ۲-۲: 
-١‏ كيف تصف أهمية البيانات في التحليلات؟ وهل SE‏ التفكيرٌ في التحليلات بدون بيانات؟ 
-Y‏ بالنظر إلى التعريف الجديد والواسع لتحليلات الأعمالء ما هي المُدخلات والمخرجات الرئيسية 
لاستمرار التحليلات؟ 
-Y‏ من أين db‏ بيانات تحليلات النشاط التجاري؟ 
£- في رأيك؛ ما أهم ثلاثة تحديات متعلّقة بالبيانات؛ للوصول إلى تحليلاتِ أفضل؟ 
0- ما المقايبسٌ الأكثر شيوعًا التي dass‏ على تجهيز البيانات للتحليلات؟ 
Y-Y‏ تصنيف Jada‏ للبيانات: 
s as‏ البيانات Y)‏ سيما في صيغتها الفردية) إلى مجموعة من الحقائق التي يتم الحصول عليها 
ole‏ كنتيجة للتجارب أو المشاهدات أو المعاملات أو الخبرات. وقد تتكوّن البيانات من الأرقام 
والحروف والكلمات والصور والتسجيلات الصوتية وما إلى ذلك» كقياسات لمجموعة من المتغيرات 
(خصائص الموضوع أو الحدث محل الدراسة). فغالبًا ما يُنظر إلى البيانات على أنها dol‏ مستوى من 
التجريد (الغموض) يتمْ استخلاص معلومات ctia‏ ومن ثم معرفة. GÍ‏ في أعلى مستوى من التجريد؛ 
فيمكن تصنيف البيانات على أنها منظمة وغير منظمة (أو شبه مهيكلة). تتكون البيانات غير/ شبه 
المهيكلة من dl‏ مزيج من المحتوى sai‏ والصور والصوت ومحتوى الويب. وستتمٌ تغطية البيانات 
غير/ شبه المهيكلة بمزيدٍ من التفصيل في فصل تعدين النص وتعدين الويب. UT‏ البيانات المهيكلة؛ 
فهي تلك التي تستخدمها خوارزميات التنقيب في البيانات» ويمكن تصنيفها على أنها فئوية أو 
رقمية. ويمكن تقسيمٌ البيانات الفئوية إلى بيانات اسمية أو ترتيبية» في حين تقسّم البيانات الرقمية 
إلى فواصل زمنية أو نسّب. يُوضّح الشكل Y-Y‏ تصنيفاً بسيطاً للبيانات. 
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شكل :Y-Y‏ تصنيف بسيط للبيانات 

- بيانات فتوية: Jig‏ علامات الفئات المتعدّدة المُستَخدّمة لتقسيم متغير إلى مجموعات مُحدَّدة. 
iás‏ أمثلة المتغيرات الفئوية كالعرق والجنس والفئة العمرية والمستوى التعليمي. وبالرغم 
من أن المتغيرين الأخيرين قد يتم SII‏ فيهما LÁ‏ بطريقة عددية باستخدام قَيّم دقيقة للعمر 
وأعلى درجة مكتملة؛ فإنه Il‏ ما يكون als] ST‏ لتصنيف مثل هذه المتغيرات إلى عدد 
صغير نسبيًا من الطبقات المرتبة. وقد يُطلّق على البيانات الفئوية Uil‏ بيانات منفصلة؛ مما 
يعني أنها J£‏ عددًا محدودًا من القيم دون اتصال بينها. وحتى إن كانت القيم Aa Sek LA‏ 
للمتغيرات الفئوية (أو المنفصلة) هي قيم رقمية؛ Gl‏ هذه الأرقام ليست FSİ‏ من رموز ولا 
eto‏ إلى إمكانية حساب قيم كسرية. : 

- بيانات اسمية: تحتوي على قياسات الرموز البسيطة المُخصّصة للأشياء كتسميات؛ ولكنها لا 
تُعتبّر قياسات. فعلى سبيل المثال: يمكن تصنيف المتغير (الحالة الاجتماعية) بشكل عام إلى )9( 
أعزب» (V)‏ متزوج» (V)‏ مطلق. كما يكن tz‏ البيانات الاسمية ذات القيم الثنائية بقيمتين 
محتملتين (على سبيل المثال: نعم/ لاء أو صواب/ خطأء أو جيد/ سيء» أو ما إلى (eU‏ أو ذات 
القيم المتعدة بثلاث قيم محتملة أو ST‏ (مثل: بني/ أخضر/ أزرقء أو أبيض/ أسود/ لاتيني/ 
آسيويء أو أعزب/ متزوج/ مطلقء أو ما إلى ذلك). 

- البيانات الترقيبية: تحتوي على jga‏ مُخصّصة للأشياء أو الأحداث كتسمياتء وفي نفس الوقت 
تعر Lá‏ عن رتبة الترتيب فيما بينهم. فعلى سبيل المثال: يمكن تصنيف ail‏ (درجة 
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الائتمان) بشكل عام إلى (Y)‏ منخفضة» أو åh ugio (Y)‏ أو (Y)‏ مرتفعة. كما هكن وَضْع 
العلاقات المرتبة الممائلة في متغيرات» مثل: الفئة العمرية (معنى: àb‏ شاب متوسط 
العمرء مسن) والمستوى التعليمي (بمعنى: المدرسة الثانوية» الكليةء الدراسات العليا). 
- البيانات الرقمية: تمثل UE‏ العددية لمتغيراتٍ oloh‏ وتشمل أمثلة المتغيرات ذات القيمة العددية 
Jl‏ وعدد الأطفالء ومجموع دخل الأسرة (بالدولار الأمريكي)ء ومسافة السفر (بالأميال)» ودرجة 
الحرارة (يمقياس فهرنهايت). كما oS‏ أن تكون القيم العددية للمتغير Bas‏ صحيحًا W)‏ كسور) أو 
حقيقية (تشمل الصحيحة بالإضافة إلى الكسور). وقد تُسمّى البياناتٌ الرقمية أيصًا بيانات مستمرة؛ 
مما يعني أنَّ المتغير يحتوي على مقادير متواصلة على مقياس odo‏ ما Qa a‏ بإدخال قيم مؤقتة. 
فبخلاف المتغير المنفصل الذي هشل بيانات محدودة وقابلة للعد. هثل المتغير المستمر قياسات قابلة 
للتطويرء ومن الممكن أن تحتوي البيانات على sas‏ لا نهائي من القيّم الكسرية. 
- بيانات فترة: هي مُتغيرات OS‏ قياسها على مقاييس الفواصل الزّمنية. هناك Ja‏ شائعٌ لقيا 
الفواصل الزمنية؛ هو درجة الحرارة المئوية. في هذا المقياس المُحدَّد تكون وحدة القياس ٠٠١ /١‏ 
من الفرق بين درجة حرارة الانصهار ودرجة حرارة الماء المغلي في الضغط الجوي؛ ها يعني عدم 
3975 قيمة صفرية „iha‏ 
- بيانات نسبية: وتشمل المتغيرات الشائعة للقياس والموجودة في علوم الفيزياء والهندسة. ids‏ 
js‏ من المجموعة والطول والوقت وزاوية الطائرة والظاكة والضّحنة الكهربائية أمثلةٌ على 
القياسات الفيزيائية التي هي مقابيس ail‏ وتستمدٌ هذا النوع من المقاييس اسمّه من 
حقيقة أنَّ القياس هو تقديرٌ النسبة بين حجم الكمية المستمرة وحجم وحدة من نفس النوع. 
وبشكل غير رسمي؛ تُعَذُ السّمة المميزة لمقياس النسبة هي Sorg‏ خانة صفرية القيمة وغير 
عشوائية. فعلى سبيل OB JE‏ مقياس درجة الحرارة كلفن له نقطة صفر غير عشوائية من 
الصفر «liat!‏ والتي تساوي (YVY, YO-)‏ درجة مئوية. Š‏ نقطة الصفر هذه غير عشوائية؛ 
OS‏ الجسيمات التي تشكل المادة عند هذه الدرجة لها طاقةٌ So‏ صفرية. 
يجب تحويل أنواع البيانات الأخرى» كبيانات النصوص والحيّز والصور والفيديو والصوت» 
إلى شكل من أشكال التمثيلٍ الفئوي أو الرقمي قبل أن تتمّ معالجثها بواسطة طرق التحليل 
(خوارزميات التنقيب في البيانات؛ 2015 (Delen,‏ كما هكن أيضًا تصنيف البيانات إلى بيانات 
ثابتة أو حركية sS)‏ سلاسل مؤقتة أو زمنية). Ja‏ بعص طرق التحليلات التنبؤية (مثل: التنقيب 
في البيانات) وخوارزميات تعلم الآلة؛ طرقاً انتقائيةً للغاية لنوع البيانات التي يمكنها التعامل معها. 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


وقد يؤدي الاعتمادٌ على أنواع بيانات غير متوافقة مع طرق التحليلات إلى الحصول على نماذج 
غير صحيحة أو (في أغلب الأحيان) A‏ عملية تطوير النموذج. فعلى سبيل المثال: تحتاج بعص 
طرق التنقيب في البيانات أن يتم dae‏ جميع المتغيرات (سواء مدخلات أو مخرجات) كمتغيرات 
ذات قيمة رقمية (مثل: الشبكات العصبيةء آلة المتجهات الداعمة الانحدار اللوجستي). Sus‏ 
تحويلٌ المتغيرات الاسمية أو الترتيبية إلى تمثيلات رقمية باستخدام أحد أنواع المتغيرات الزائفة من 
١‏ إلى ن Ma)‏ يمكن تحويلٌ متغير فئويّ له ثلاث قيم مختلفة إلى ثلاثة colis‏ زائفة ذات قيم 
ثنائية ٠‏ أو .)١‏ ولأن هذه العملية قد تزيدٌ من عدد امتغيرات؛ فلا بد من الحَذر بشأن تأثير هذه 
التمثيلات؛ ole‏ فيما يتعلق بالمتغيرات الفئوية التي تحتوي على أعداد كبيرة من القيم الفريدة. 
وبالمثل؛ تحتاج بعض طرق التحليلات dI‏ مثل ID3‏ (خوارزمية شجرة القرارات الكلاسيكية) 
والمجموعات الخام (خوارزمية قاعدة الاستقراء الجديدة (Gnu‏ إلى تمثيلٍ جميع المتغيرات كمتغيرات 
قطعية القيمة. وقد calls‏ الإصداراث القدهة من هذه الطرق من المستخدم أن يقوم Jais‏ 
وتمثيل المتغيّرات الرقمية في مجموعات فئوية قبل أن تتم معالجتها بواسطة الخوارزمية. والخبر 
JI‏ هو of‏ معظم تطبيقات هذه الخوارزميات في أدوات البرامج المتاحة على نطاق واسع تقبل 
مزيجًا من المتغيرات الرقمية والاسمية وتقوم داخليًا بإجراء التحويلات اللازمة قبل معالجة البيانات. 
تظهر البياناث في العديد من أنواع المتغيرات المختلفة والرسومات البيانية. تتحسّن أدواثُ تحليل 
الأعمال باستمرار في قدرتها على مساعدة علماء البيانات في المهمة الشاقة المتمثلة في تحويل وتمثيل 
البيانات؛ بحيث هكن تنفيذُ متطلبات البيانات الخاصة بنماذج وخوارزميات تنبؤية dadoh‏ بشكل 
صحيح. وتوضّح الحالة العملية ١-۲‏ سيناريو العمل الذي قامت فيه شركة الأبحاث والتطوير الخاصة 
بالأجهزة الطبية الغنية بالبيانات بتبسيط أنشطة التحليلات لديها؛ بهدف الوصول بسهولة إلى JS‏ 
من البيانات والتحليلات التي تحتاجها لمواصلة أعمال الابتكار والجودة بها على أعلى المستويات. 
حالة عملية 1-١‏ 
شركة أجهزة طبية تضمّن جودة المنتج مع توفير JU!‏ 
تتط ؤر بعص التقنيات بشكل أسرع منها في ا مجال الطبي؛ لذا فقد jio‏ امتلاك 
برامج التحليلات المتقدّمة المناسبة من قواعد اللعبة. Jana dais‏ الأجهزة رائدًا في 
تطوير وتصنيع وتوزيع الأجهزة الطبية والتقنيات المتعلقة بهاء ها في ذلك التقنية التي 
أحدثت s‏ في اختبارات الدم الكامل والتخثر. وللمساعدة في ضمان استمرار lase‏ 
ونجاحهاء تعتمدٌ الشركة على تحليلات البيانات „Dell Statisticas‏ 
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المشكلة: 


وباعتبارها شركةً رائدةً في سوق أدوات التشخيص الخاصة بالرعاية الحرجة والتخثر؛ 
لذا يجب أن يستفيد asa‏ الأجهزة من التقنيات السريعة التطور مع الحفاظ على JS‏ 
من الجودة والكفاءة في تطوير وتصنيع وتوزيع منتجاته. وعلى وجه الخصوص؛ فقد 
is‏ الشركة علماءها ومهندسيها في مجالي البحث والتطوير من سهولة الوصول إلى 
ثروة غزيرة من البيانات ومن ثم تحليلهاء بجانب الكفاءة في مراقبة عمليات التصنيع 
وسلاسل التوريد. 

qos:‏ جون ies‏ محلل الأعمال ,لعمل الأجهزة: «مثل العديد من الشركات. كنا أغنياء 
بالبيانات؛ ولكن فقراء في التحليل؛ فلم يعد من الممكن أن ينجح مُحللو البحث والتطوير في 
الوصول إلى تقنية المعلومات في JS‏ مرة يحتاجون فيه ا إلى الوصول إلى بيانات الاختبارء ومن 
ثم إجراء تحليلات ممرة واحدة في Minitab‏ بل يجبٌ أن يكون لديهم القدرة على الوصول إلى 
البيانات بسرعة وإجراء تحليلات مُعقّدة بشكلٍ متسق ودقيق». 

كان duis‏ تحليلات متطوّرة لمعمل الأجهزة Gal‏ حسام وذلك بسبب حجم وتعقيد 
منتجاتها. فعلى سبيل المثال: تقوم الشركة JS‏ عام بتصنيع Cola‏ الآلاف من اللفائف 
التي تحتوي على بطاقة بها مجموعة متنوعة من أجهزة الاستشعار التي تقوم بقياس 
الإشارات الكهربائية للدم في أثناء عملية الاختبار. 

يقول يونج: ”تتأثر أجهزةٌ الاستشعار هذه بعوامل عديدة جدًاء من التغيرات 
البيئية» مثل: الحرارة والرطوبة إلى عدم تناسق اللواد الواردة؛ لذلك فإننا نقوم وبشكلٍ 
متواصلٍ dle‏ أدائها. إننا نجمغ ملايين ]2 caa‏ من البيانات» والتي يتم تخزين 
معظمها في قواعد بيانات SQL Server‏ وكنا في حاجة إلى منصة تحليلية 95 فرق 
البحث والتطوير التابعة لنا من الوصول بسرعة إلى تلك البيانات والتدخُل السريع dod‏ 
isl‏ مشكلات قد تحدث. وأيضًا؛ ونظرًا لوجود العديد من العوامل في اللعبة؛ فقد احتجنا 
إلى برنامج lab‏ يمكنه مراقبة بيانات الاختبار بذكاء وتنبيهنا إلى المشكلات الطارئة 
بشکل فوري“. 

الحل: 

بدأ Jana‏ الأجهزة بالبحث عن Cao jo‏ لتلبية احتياجاته. فقامت الشركة سريعاً 
بإزالة معظم الأدوات من السوق؛ لأنها فشلت في تقديم الوظائف الإحصائية ومستوى الثقة 
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المطلوبة لبيئة الرعاية الصحية. مع ترك اثنين من اممنافسين: الأول Statistica‏ وحل تحليلي 
آخر وهو .Dell Statistica‏ بالنسبة لمعمل الأجهزة. كان الفائز الواضح هو „Statistica‏ 

يقول يونغ: «کان اختيار Statistica‏ 5,5 سهلًا؛ فمع US Statistica‏ من إنشاء 
مجموعة da als‏ من تشكيلات التحليل العالية المستوى للبيانات الخاصة بنا؛ وذلك 
ليستخدمها الممحلّلون على نطاق المؤسسة بأكملها. والآن؛ عندما يريدون فهم أشياء 
مُحدّدة؛ يمكنهم ببساطة إجراءٌ cla dalos‏ من هذا المتجر المركزي بدلا من الاضطرار 
إلى طلب تقنية المعلومات للوصول إلى البيانات أو تذكر كيفية إجراء اختبار محين». 

إضافةً إلى ذلك؛ كانت faal Statistica‏ بكثير في الاستخدام والنشر من حلول 
التحليلات القدهة. يدون يونج في ملاحظاته: sb‏ والإبقاء على حلولٍ تحليلية أخرى, 
تحتاج إلى معرفة برمجة حلول التحليلات؛ ولكن مع Statistica‏ يمكنني الاتصالٌ بالبيانات 
الخاصة بناء وتحليلها ونشرها في غضون ساعة - على الرغم من أنني Cad‏ مبرمجًا عظيمًا». 

if ol,‏ بالإضافة إلى وظائفها المتقدّمة وسهولة استخدامها؛ فقد قدّمت شركة 
Statistica‏ دعا lle‏ وخدمةً سعريةً A alie‏ يقول يونغ: Ól»‏ الأشخاصّ الذين 
ساعدونا في تطبيق نظام Statistica‏ كانوا ببساطة رائعين وكان السعرٌ JS]‏ بكثير مما 
يتيحه أي حل آخر للتحليلات». 

النتائج: 

مع ‘Statistica‏ أصبح الآن لدى ios‏ المشروع القدرة على الوصول dead!‏ إلى كل 
من البيانات والتحليلات التي يحتاجونها لمواصلة US‏ من الابتكار والجودة في معمل 
الأجهزة. في الواقع؛ فإِنّ التحليلات السريعة والفعّالة وكذلك التحذيراثٌ الآلية من 
جانب js Statistica‏ للشركة مئات الآلاف من الدولارات. 

يقول يونج: ”في أثناء تصنيع خرطوشة الجبر؛ نتعرّض من حين لآخر لبعض 
المشكلاتء مثل عدم الدقة في التركيب الكيميائي الذي 5e‏ على أحد أجهزة الاستشعار. 
إن تخريد دفعة واحدة من البطاقات قد يكنّفنا مئات الآلاف من الدولارات. غير Ši‏ 
Statistica‏ تساعدنا على اكتشاف الخطأ بسرعة وإصلاحه مما يُجِنْبنا تلك التكاليف. 
فمثلا يمكننا تزويجٌ بيانات الاختبار مع بيانات سجل تاريخ الأجهزة الإلكترونية من بيئة 
SAP‏ الخاصة بنا وإجراء JS‏ أنواع الارتباطات لتحديد (el‏ التغيّرات يؤدي إلى مشكلة 
من هذه التغيرات ia‏ التغيّرات في درجة الحرارة والرطوبة. 
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ollas X. s‏ التحقق من الجودة اليدوية ذات قيمة كبيرة so‏ تأكيد؛ ولكن تدير 
sgar ISLA Statistica‏ متنوعةً من التحليلات للشركة. بشكلٍ يضمن عدم حدوث 
csl‏ خطأ واكتشاف المشكلات بسرعة. يقول يونغ: «من امقرّر إجراء العديد من عمليات 
التحليل بشكل 5555( لفحص أشياء مختلفة؛ فإذا تمّ اكتشاف مشكلة؛ فسيقوم النظام 
تلقائيًا بتنبيه المسؤولين عبر البريد الإلكتروني أو تسجيل المخالفات بقاعدة البيانات». 

oj‏ بعض المزايا الرئيسية لتحليلات البيانات المتقدّمة مع Statistica‏ تشتملٌ على ما يلي: 

- الالتقزام بالتنظيم: بالإضافة إلى توفير أموال معامل أجهزة القياس؛ تضمّن 
Statistica‏ كذلك pl:‏ عمليات الشركة بقوانين إدارة الأغذية والأدوية (FDA)‏ فيما 
يتعلّق بالجودة والاتساق. يُوضّح يونج ما يلي: «لأننا نقوم بتصنيع الأجهزة الطبية؛ فإننا 
نخضع لنظام إدارة FDA‏ تساعدنا Statistica‏ على إجراء عمليات التحقق الإحصائية 
التي تتطلبها إدارة FDA‏ - فعلى سبيل المثال: يمكننا بسهولة SLS)‏ أنَّ مجموعتين من 
المنتجات المصنوعة باستخدام مواد كيميائية مختلفة هي نفسها إحصائيًا». 

- ضهان الاتساق: l‏ ترتيبات التحليل 5l‏ 84 في Statistica‏ والتي هكن 
استخدامُها في أثناء (Sl‏ مشروع تضمّن التناسق والجودة في معمل الأجهزة. يقول 
يونج: ”وعند Jalos‏ البيانات يمكنك الحصولٌ على نتائج مختلفة تبعًا للطريقة التي 
تستخدمها في التحليل. ad‏ قد يستخدم fle‏ مختلفون alas]‏ مختلفةٌ على البيانات» 
أو لا يقومون بتلخيصها db]‏ عندئذ فسيحصلون جميعًا على نتائج مختلفة أمّا مع 
Statistica‏ فنستطيع أن نضمّن of‏ جميع العلماء في جميع مراحل المشروع يقومون 
بإجراء التحليلات بنفس الطريقةء وبهذا نحصل على نتائج متناسقة.» 

- مراقبة سلسلة التوريد: لا يقوم معمل الأجهزة بتصنيع البطاقة» وبها أجهزة 
استشعار فحسب؛ بل تقوم بتصنيع الجهاز الطبي بالكاملء وبالتالي فهو يعتمدٌ على 
ا مورّدين لإمداده بالأجزاء المطلوبة. ولمزيد من ضمان الجودة, يُخطّط الشركة لتوسيع 
نطاق تعاملها مع Statistica‏ لمراقبة سلسلة التوريد. 

- توفير الوقت: بالإضافة إلى توفير الأموال ورفع مستوى الالتزام بالتنظيم لمعمل 
الأجهزةء تعمل شركة LÉ Statistica‏ على توفير الوقت الثمين ممهندسي وعلماء الشركة؛ 
مما نهم من التركيز QS ia‏ أكبر على الابتكار Xs‏ من الروتينيات. يدون يونج في 
ملاحظاته: «توفر التنبيهات الاستباقية من Statistica‏ للمهندسين الكثيرَ من الوقت؟ 
فهم ليسوا بحاجة Si‏ فحص العوامل المختلفة طوال الوقت» مثل: نقص الجلوكوز؛ 
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فهذا اختبارٌ واحدٌ؛ لكنه يسغرق نصف اليوم. أما في ظل مراقبة Statistica‏ لبيانات 
الاختبار لدينا؛ فبإمكان المهندسين SSAI‏ على أمور أخرى؛ لعلمهم بأنه سيصلهم بريد 
إلكتروني إذا أَذّى نقصٌ الجلوكوز لأيّ مشكلة». 

الاحتمالات المستقبلية: 

Ó}‏ معمل أجهزة القياس مُتحمّس جدًا للفرص التي Rio‏ ت من خلال الرؤية التي 
يوفرها برنامجٌ التحليلات المتقدّمة من Statistica‏ في مخازن البيانات الخاصة به. يقول 
يونج: ”باستخدام ‘Statistica‏ كنك اکتشاف جميع أنواع الأفكار المتعلقة ببياناتك. والتي 
قد لا 95063 من العثور عليها. فقد يكون أمامك مكاسبٌ مادية خفية؛ لكنك لا تراها ELY‏ 
لم تحلل بياناتك كما ينبغي. فباستخدام تلك SIDI‏ اكتشفنا بعض الأشياء المثيرة للاهتمام 
في بياناتنا والتي وفرت eS a UJ‏ جدًا من «JUI‏ ونتطلّع إلى إيجاد المزيد منها». 

أسئلة للمناقشة: 

-١‏ ماهي التحدَّيات الرئيسية لشركة الأجهزة الطبية؟ وهل 3& قيادة السوق 
أو التقنية؟ اشرح. 

-Y‏ ما هو adl‏ المقترح؟ 


S(ROI) التوصل إليها؟ وما رأيك في العائد الحقيقي للاستثمار‎ S ما هي النتائج التي‎ -Y 
Source: Dell customer case study. Medical device company ensures product quality 
while saving hundreds of thousands of dollars. https://software.dell.com/documents/ 
instrumentation-laboratory-medical-device-companyensures-product-quality- 
whilesaving-hundreds-ofthousands-of-dollars-case-study-80048.pdf (accessed 
August 2016). Used by Permission from Dell. 


أسئلة مراجعة على القسم Y-Y‏ 
-١‏ ما هي البيانات؟ وكيف تختلف البيانات عن المعلومات والمعرفة؟ 


-Y‏ ما هي GUI‏ الرئيسية للبيانات؟ ما هي أنواعٌ البيانات التي OLÉ‏ استخدامها في ذكاء الأعمال 


wr 


والتحليلات؟ 


$9 150, استخدامٌ نفس تمثيل البيانات لجميع نماذج التحليلات؟ ناذا أو‎ Use هل‎ -Y 


-٤‏ ما هو تمثيل بيانات -١‏ من - ن؟ BU‏ وأين يتم استخدامها في التحليلات؟ 
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€-Y‏ فن وعلم معالجة البيانات: 

ale‏ ما تكون البيانات في شكلها الأصلي (أَيْ: بيانات العالم الحقيقي) ليست jalo‏ للاستخدام 
في elus‏ التحليلات. فغاليًا ما تكون كثيرة الأخطاء ومنحرفةً ومُعقدةً للغايةء وغير دقيقة؛ لذا فإنه 
من الضروري LÄ‏ هنا بعملية شاقة ومُكلّفة من ناحية الوقت ias)‏ عملية ا معالجة المسبقة 
للبيانات) بغرض تحويل بيانات العام الحقيقي إلى شكل جيد الدقة لاستخدامها في خوارزميات 
التحليلات )2006 (Kotsiantis, Kanellopoulos, & Pintelas,‏ ويقرٌ العديدٌ من مُحترفي 
التحليلات d‏ الوقت add‏ 3555 في معالجة البيانات (والذي قد يكون أقلّ مراحل العملية امتاعًا) 
يكون أطول بكثير من الوقت المُستَغْرّق في بقية مهام التحليلات (متعة بناء نموذج التحليلات 
وتقييمها). ويوضّح الشكل Y-Y‏ الخطوات الرئيسية في محاولة معالجة البيانات. 

في المرحلة الأولى من المعالجة aic all‏ للبيانات؛ يتخ جمعٌ البيانات المتعلّقة بالدراسة من 
المصادر 83d‏ لذلك» ex‏ تحديدٌ السجلات والمتغيرات الضرورية (استنادًا على الفهم العميق 
للبيانات» مع تصفية المعلومات غير الضرورية)» كما يتم تكامل/ AS‏ الس collec‏ الواردة من 
بيانات متعددة المصادر (وأيضًا باستخدام الفهم العميق للبيانات GS‏ التعامل مع المرادفات 
وا متضادات المتشابهة بشكل صحيح). 

في المرحلة الثانية من معالجة البيانات؛ يتم تنظيف البيانات )3555 هذه الخطوة أيضاً 
ب تنقية البيانات). oled‏ ما تكون البياناتُ في شكلها الأصلي/ الخام/ الحقيقي كثيرة الأخطاء 
Stolfo, Kim; 19985 Hernández)‏ وآخرون» (Y-Y‏ في هذه الخطوة؛ يتم تحديدٌ القيم في 
مجموعة البيانات والتعامل معها. في بعض الحالات؛ 25 JS‏ القيمُ المفقودة شذوذاً في مجموعة 
البياناتء وفي هذه الحالة AY‏ من حصرها gi)‏ قيم محتملة لها) أو تجاهلهاء ds‏ حالات 
أخرى؛ تكون القيمٌ المفقودة lijo‏ طبيعيًا من مجموعة البيانات Mas)‏ غالبًا ما يتم ترك خانة 
دخل الأسرة بدون إجابة من أصحاب الدخل المرتفع). في هذه الخطوة؛ يجب Ul‏ على المحلّل 
تحديدٌ القيم الصاخبة في البيانات (أيْ: القيم المتطرفة) ومن ثم تسهيلها. بالإضافة إلى ذلك؛ يجب 
dolei‏ مع حالات عدم الاتساق في البيانات (كوجود قيم غير عادية ضمن متغير) باستخدام 
معرفة مجال الدراسة و/ أو رأي الخبير. 

في المرحلة الثالثة من معالجة البيانات؛ يتم تحويل البيانات من أجل معالجة أفضل. فعلى 
سبيل المثال: في العديد من الحالات» يتم توزيعٌ البيانات توزيعًا طبيعيًا بين حَدَّين dol)‏ وأقصى) 
مُحدّدين؛ وذلك لجميع المتغيّرات؛ بهدف تخفيف jioa‏ المحتمل متغير واحدٍ (به o$‏ عددية 
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كبيرةء مثل دخل الأسرة) يحتوي على متغيرات أخرى (لها قيمٌ أصغرء مثل عدد مَنْ يعول أو 
سنوات الخدم ة) والتي قد تكون أكثر nal‏ وهناك تحويل آخر يتم إجراؤه وهو التفريد و/ 
أو التجميع. d‏ بعض الحالات؛ يتم تحويل المتغيرات الرقمية إلى قيم فئوية (مثل: منخفض - 
متوسط - مرتفع)» وفي oo‏ أخرى؛ يتم LS‏ النطاق الفريد لقيمة المتغير الاسمي إلى مجموعة 
أصغر باستخدام مفهوم التسلسل الهرمي Ae)‏ سبيل المثال: عند استخدام حالات فردية تحتوي 
على ٠‏ قيمة مختلفة, قد يستخدمٌ المحلّل Bie‏ مناطق للتغير يُظهر الموقع)؛ وذلك للحصول على 
مجموعة بيانات تكون أكثر ELE‏ للتعامل مع الحاسب. ومع ذلك؛ ففي حالاتٍ أخرىء قد يختار 
المحلّل إنشاء متغيرات جديدة ias‏ على المتغيرات الحالية لزيادة معنوية المعلومات الموجودة 
بمجموعة المتغيرات في حزمة البيانات. 





6 gu 
< gend 
*  تاراركتلا إزالة‎ 
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فعلى سبيل JEL‏ في مجموعة البيانات الخاصة بزراعة الأعضاء قد يختارٌ المحلل استخدام 
متغير مفرد m‏ حالة match, 0 = no-match) el‏ = 1( بدلا من استخدام قيم منفصلة 
متعددة الصور لنوع الفصيلة لدى كل من المتبرع والمتلقي. وقد يؤدي هذا التبسيط إلى زيادة 
محتوى المعلومات مع تقليل تعقيد العلاقات في البيانات. 


Lal‏ ا مرحلة النهائية من معالجة البيانات الأؤّبية فهي تقليل البيانات. وعلى الرغم من أن 
علماء البيانات (أيّ: محترفو التحليلات) يحبُون الحصول على مجموعات كبيرة من البيانات؛ فإنَّ 
البيانات الزائدة قد تكون Lal‏ مشكلة. بمعنى أبسط؛ هكن للمحلّل أن يتصور البيانات الشائعة 
الاستخدام في مشاريع التحليلات التنبؤية كملفٍ ثابت يتكوّن من يُعدّين: المتغيرات (عدد 
الأعمدة) والحالات/ السجلات (عدد الصفوف). في بعض الحالات (كمعالجة الصور ومشاريع 
genome‏ مع بيانات microarray‏ معقدة)» کن أن يكون Sas‏ المتغيرات (التي تم تمثيلها 
بالأعمدة) كيا نسبيًاء ويجب على ا محلل تقليل العدد إلى حجم يسهل التحكم فيه. تُسمّى 
هذه العملية عادةً تخفيض الأبعاد (أو انتقاء المتغير)؛ وذلك Y‏ المتغيرات $5 معالجتها كأبعاد 
مختلفة تصف ظاهرةً من منظورات مختلفة» في التحليلات التنبؤية والتنقيب في البيانات. وعلى 
الرغم من عدم وجود طريقة واحدة مُثلى لإنجاز هذه المهمة؛ فإنه يمكن للمحلل استخدامٌ نتائج 
سابقة النشرء واستشارة خبراء المجال محل الدراسة» وإجراء اختبارات إحصائية مناسبة (مثل: 
تحليل المكوّنات الأساسية أو تحليل المكوّنات (alis ul‏ والأكثر تفضيلًا هو استخدام مزيج من 
هذه التقنيات لتقليل أبعاد البيانات بنجاح إلى مجموعة فرعية أكثر LB‏ للإدارة وأكثر sco‏ 


وفيما axo i lun‏ الآخر ssl)‏ عدد الحالات والتي يتم تمثيلها في الصفوف)؛ قد تتضمّن 
بعضٌ خُزم البيانات ملايين أو مليارات من السّجلات. وعلى الرغم من ازدياد قوة الحوسبة بصورة 
مضاعفة؛ ol‏ معالجة مثل هذا العدد الكبير من السجلات قد لا يكون lae‏ أو ممكنًا. وفي di‏ 
هذه الحالات؛ قد نحتاج إلى تحليل due‏ عبارة عن حزمة فرعية من البيانات. Aids‏ الافتراض 
الأساسي لأخذ العينات هو o]‏ المجموعة الفرعية من البيانات سوف تحتوي على جميع الأنماط 
المتعلقة بمجموعة البيانات الكاملة. يجب أن يكون ال محلل شديد الحذر عند اختياره للمجموعة 
الفرعية من البيانات» والتي cama‏ أن تعكسٌّ جوهر مجموعة البيانات الكاملةء وليست خاصة 
بمجموعة فرعية أو d‏ فرعية. eos‏ 5,3 البيانات ole‏ على بعض المتغيّرات» وقد يقودنا Jod‏ 
e‏ من أعلى البيانات أو أسفلها إلى بيانات مُتحيّزة لقيم مُحدّدة من المتغير المفهرس؛ لذلك 
حاول Glo‏ اختيار الس جلات الموجودة في مجموعة العينات بشكل عشوائي. وبالنسبة للبيانات 
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المنحرفة, قد لا يكون Åi‏ عيناتِ عشوائية بصورة مباشرة 8 بل قد يكون الأفضلٌ هو أخذ عينة 
طبقية (أيْ: إجراء Ji‏ نسبي لمجموعاتٍ فرعية مختلفة من البيانات المتاحة ضمن مجموعة 
بيانات العينة). وعند التعامل مع البيانات المنحرفة Gad‏ بنا تحقيق التوازن بين البيانات 
شديدة الانحراف؛ إما من خلال الإفراط أو التقصير في تمثيل الفتات الأكثر تمثيلًا. وقد أظهرت 
الأبحاث أنَّ مجموعات البيانات المتوازنة تميل إلى إنتاج نماذج تنبؤ أفضل من النماذج غير المتوازنة 
«(eY ١6 35,515 Thammasiri)‏ 


يتم تلخيصٌ جوهر معالجة البيانات في الجدول A-Y‏ الذي يرسم المراحل الرئيسة e)‏ إلى 
جنب مع أو صاف مشكلاتها) إلى قائمة تمثيلية laa‏ والخوارزميات. 


يكاد يكون من المستحيل ÅLEN‏ من قيمة اقتراح معالجة البيانات. وهي واحدةٌ من تلك 
الأنشطة التي تتطلب C85‏ طويلًا؛ حيث G3‏ الاستثمار في الوقت والجهد BU‏ هائلة تغطي على 
تناقص العائدات. وهذا يعني أنه كلما زادت الموارد التي تستثمر فيها؛ زادت الأرباح في النهاية. 
توضّح الحالة العملية Y-Y‏ دراسة مثيرةً للاهتمام؛ إذ يتم استخدام البيانات الأكادهية الخام 
d oils‏ بسهولة داخل منظمة تعليمية لتطوير نماذج تنبؤية لفهم تسرب الطلاب المبتدئين» 
وتحسين استبقاء الطلاب الجدد في مؤسسة التعليم العالي الكبيرة. بناءً على ما هو مُوضّح في 
الحالة العملية؛ ÓL‏ كلّ daga‏ من عمليات معالجة البيانات الموضّحة في الجدول 1-7 كانت Ago‏ 
للتنفيذ الناجح لمشروع التحليلات ra LI‏ لا سيما المهمة المتعلقة dise‏ مجموعة البيانات. 


جدول ١-۲‏ : ملخص لهام معالجة البيانات» والأساليب اممحتملة 





ألمهمة الرئيسية المهام الفرعية الطرق الشائعة 
- الوصول للبيانات وجمعها. |- استعلامات SQL‏ وكلاء البرامج خدمات 
- اختيار وتنقية البيانات. الويب. 





- تكامل وتوحيد ٠ OGLI‏ - الخبرة في المجالء استعلامات SQL‏ 

توحيد البيانات الاختبارات الإحصائية. 

- استعلامات SQL‏ وخبرة ا مجالء وتصتيف 
البيانات المعتمدة على علم الأنتولوجي. 
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الطرق الشائعة 


المهام الفرعية 


المهمة الرئيسية 





في | - ملء القيم المفقودة (الانحرافات) مع القيم 


الأكثر ملاءمة (الوسيط الوسط الحسابي» 

dod‏ الأدنى/ Sol‏ الأقصىء المنوال... إلخ). 
ol al -‏ قيمةٍ ثابتةء مثل "ML"‏ للقيم المفقودة؛ 

Jaw AI]‏ القيمة المفقودة؛ عدم فعل أي شيء. 


- التعامل مع القيم المفقودة 
البيانات. 





في|- تحديد القيم المتطرفة في البيانات 


تحديد وتقليل الضوضاء 





باستخدام تقنيات إحصائية بسيطة (مثل: 
المتوسطات. والانحرافات المعيارية) أو 
بالتحليل العنقودي؛ أو بمجرد تحديدها 
نقوم بإزالة القيم المتطرفة أو تسهيلها 
باستخدام الثنائيات أو الانحدار أو 
المتوسطات البسيطة. 


البيانات. 





- تحديد القيم الخطأ في البيانات (بخلاف 
القيم المتطرفة). مثل: القيم الفردية, 
تصنيفات الفئات غير المتسقة» التوزيعات 
الفردية؛ ومجرد تحديدهاء استخدم 
خبرات المجال لتصحيح القيم الخطأء أو 
إزالة السجلات المشتملة على قيم خطأ. 


إيجادء وإزالة البيانات الخطأ. 


تنظيف البيانات 





- تقليل نطاق القِيم في كل متغير ذي قيمة رقمية 
إلى نطاق معياري (على Jae‏ المثال: ٠‏ إلى ١‏ 
أو V-‏ إلى )١+‏ باستخدام مجموعة متنوعة من 
تقنيات التورزيع الطبيعي أو القياس. 


توزيع البيانات melo‏ 


تحويل البيانات 





- إذا لزم الأمر؛ نقوم بتحويل المتغيرات الرقمية 
إلى تمثيلات منفصلة باستخدام تقنيات 
متعلقة بنطاق أو تكرار المتغيرات الفئوية, 
والحَدٌ من عدد القيم من خلال تطبيق 
التسلسل الهرمي للمفاهيم السليمة. 








فصل أو تجميع البيانات. 
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الطرق الشائعة 


المهمة الرئيسية المهام الفرعية 





- استنباط مُتغيرات جديدة وذات معلومات 
أكثر من المتغيّرات ابلوجودة بالفعل باستخدام 
مجموعة واسعة من الدوال الرياضية (بسيطة 
مثل الجمع والضربء أو معقدة مثل مزيج 
مختلط من تحؤلات السجل). 


بناء سمات جديدة. 





- تحليل المكؤن الرئيسيء تحليل مكوّن 
مستقلء اختبار chi-square‏ تحليل 
الارتباطء واستقراء شجرة القرارات. 


تقليل عدد السّمات. 
تقليل المعلومات 





سحب ls e‏ للعينات. سحب طبقي 
للعينات» سحب olo‏ للعينات باستخدام 
الخبرة والمعرفة السابقة. 

استخلص Jl‏ تمثيل أو تمثيل الفئات الأكثر تمثيلًا 








توازن البيانات المنحرفة. 


تقليل عدد السّجلات. 











wa 


Y-Y عملية‎ di» 
تحسين الاحتفاظ بالطلاب باستخدام التحليلات المعتمدة على البيانات‎ 


أصبحت ظاهرةٌ تسرب الطلاب واحدةً من أكثر التحَدّيات التي تواجه صانعي 
القرار في المؤسسات الأكاديمية. فعلى الرّغم من ÍS‏ البرامج والخدمات التي تمّ وضعها 
للمساعدة في الاحتفاظ بالطلاب؛ وفقًا لوزارة التعليم الأمريكية ومركز الإحصائيات 
التعليمية (nces.ed.gov)‏ فلا يحصل على درجة البكالوريوس أكثر من نصف الذين 
يلتحقون بالتعليم العالي. أصبحت إدارة التسجيل والإبقاء على الطلاب أولويةٌ قصوى 
ممديري الكليات والجامعات في الولايات المتحدة وبلدان أخرى حول العالم. olad‏ ما 
يؤدي التسرّب الكبير للطلاب إلى خسارة مالية dale‏ وانخفاض معدلات التخرّج» وسمعة 
تربوية dol‏ نظر جميع أصحاب المصلحة. إذ يبحث JS‏ من المشرّعين وصانعي 
السياسات الذين يشرفون على التعليم العالي ويُخمّصون له الموازات do pid‏ وكذلك 
الآباءٌ الذين يدفعون تكاليف تعليم أبنائهم؛ بغرض إعدادهم لمستقبلٍ أفضلء وأيضًا 
الطلاب الذين يختارون التخصُصات الجامعية - يبحث JS‏ هؤلاء - عن أدلة على الجودة 
المؤسسية والسّمعة لتوجيه عمليات صُنع القرار الخاصة بهم. 
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exi dort 

لتحسين الاحتفاظ بالطلاب؛ يجب على Ial Jio]‏ أن يحاول فهم الأسباب غير 
لواهية وراء التسرّب من التعليم. ولكي ننجح في ذلك؛ علينا Ss]‏ أن نحَدّد وبدقة 
الطلاب الذين يُداهمهم خطر التسرّب. حتى الآن؛ تمّ تكريسٌُ الغالبية العظمى من 
بحوث استنزاف الطلاب لفهم هذه الظاهرة الاجتماعية المعقدة والحاسمة في نفس 
لوقت. وعلى الرّغم من أن هذه الدراسات النوعية والسّلوكية والاستقصائية كشفت 
عن رؤية ثمينة للغاية من خلال تطوير واختبار مجموعة واسعة من النظريات؛ فإنها 
لا توفر الآلية اللازمة للتنبؤ الدقيق (والتطؤر المحتمل) لتسرّب الطلاب. قدَّم المشروع 
المختصر في دراسة هذه الحالة نهجًا بحثيًا aS‏ إذ هكن استخدام البيانات المؤسسية 
التاريخية من قواعد بيانات الطلاب لتطوير نماذج قادرة على التنبؤ بالإضافة إلى توضيح 
طبيعة المؤسسة الخاصة بمشكلة التسرِّب. ويوضّح الشكل ٤-۲‏ منهج التحليلات المقترح. 

وعلى الرغم من كون المفهوم جديداً نسبيًا على التعليم العالي لأكثر من عقد من 
لزمان؛ فقد تمت دراسة مشكلات مماثلة في مجال إدارة التسويق باستخدام تقنيات 
تحليلات البيانات التنبؤية تحت اسم «churn analysis»‏ بغرض الإجابة عن السؤال 
التالي: «مّن من عملائنا الحاليين أكثر ميلاً للتوقف عن شراء منتجاتنا أو خدماتنا؟» 
بحيث هكن إجراء نوع من عمليات الوساطة أو التدخل للإبقاء عليهم؛ إذ Sd‏ 
الاحتفاظ بالعملاء الحاليين Tal‏ بالغ الأهمية؛ لأننا وكما نعلم جميعًاء وكما أظهرت 
البحوث المتعلقة مرارًا GSSs‏ أن تكاليف وجهد ووقت گب عميل جديد أكثر بقدرٍ 
كبير من محاولة الحفاظ على العميل الموجود بالفعل. 

البيانات من الجوهر: 

جاءت بيانات هذا المشروع البحثي من مؤسسة واحدة (وهي جامعة عامة شاملة 
تقع في منطقة الغرب الأوسط بالولايات المتحدة) متوسط تسجيل يبلغ 77٠٠١‏ طالب» 
منهم حوالي ZA‏ من المقيمين في نفس الولايةء وحوالي 19“ منهم من الأقليات. لا يُوجَد 
فرقٌ معنوي بين الجنسين في أرقام التسجيل. كان متوسط نسبة الاحتفاظ بالطلاب 
الجّدد في المؤسسة حوالي ۸٠‏ ومتوسط نسبة التخرّج Bal‏ 1 سنوات حوالي XV‏ 








استخدمت الدراسة © سنوات من البيانات ا مؤسسية» والتي شملت أكثر من ١5٠٠١‏ 
طالب مُسجلين كطلاب جُدُّد. 3( جمعهم من قواعد بيانات مختلفة ومتنوعة للطلاب 
الجامعيين. وقد CALAS‏ البياناتٌ المتغيرات المتعلقة بالخصاكص الأكادهية واطالية 
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والتوزيع السكاني للطلاب. وبعد دمج وتحويل البيانات المتعددة الأبعاد SJ‏ طالب إلى 
ملف plas‏ واحد ssl)‏ ملف يحتوي على أعمدة Jig‏ المتغيرات وصفوف تمثل سجلات 
الطالب)» تم Rau‏ الملف الناتج ومعالجته مسبقاً لتحديد ومعالجة القيم الشاذة وغير 
القابلة للاستخدام. فعلى سبيل المثال: قامت الدراسة بإزالة كل سجلات الطلاب الدوليين 
من حزمة البيانات؛ لأنها b‏ تحتو على معلومات عن بعض المتنبئين ذوي sal]‏ الطيبة 
(مثل: المدرسة الثانوية «GPA‏ ودرجات (SAT‏ في مرحلة تحويل البيانات؛ تم تجميعٌ 
بعض المتغيرات. (فمثلاً: يتم تجميع المتغيرات ”الرئيسية“ و”الكثيفة“ إلى متغيرات 
ثنائية (ConcentrationSpecified s MajorDeclared‏ للحصول على تفسير أفضل 
للنمذجة التنبؤية. بالإضافة إلى ذلك؛ 65 استخدام بعض المتغيرات لاشتقاق متغيرات 
جديدة (مثل: نسبة المكتسب/ ا مسجل وسنوات ما بعد المدرسة الثانوية). 


M Se. 2 

























































































شكل :٤-۲‏ منهج التحليلات للتنبؤ بتسرّب الطلاب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري w‏ 


الفصل الثاني 


المكتسبة/ المسجلة - الساعات المكتسبة/ الساعات المسجلة 
سنوات ما بعد المدرسة الثانوية = سنة تسجيل في الجامعة - سنة التخرّج من المدرسة الثانوية 

تمّ إنشاء النسبة المكتسبة/ المسجّلة؛ للحصول على Jis‏ أفضل مرونة الطلاب 
وتقريرهم في الفصل الدراسي الأول من السنة الدراسية الأولى في الجامعة. وبشكلٍ 
منطقي؛ فإنه من المتوقع أن تؤثر القيم الأكبر لهذا المتغير JS aa‏ إيجابي على 
الاستبقاء/ الثبات. تمّ إنشاء مصطلح سنوات ما بعد المدرسة الثانوية لقياس 
تأثير الوقت 5s adl‏ بين التخرّج من المدرسة الثانوية والتسجيل الأَوّلي بالكلية. 
ومنطقيًا؛ فمن المتوقع أن يُسهم هذا المتغيّر في التنبؤ بتسرّب الطلاب. يتم تحديدٌُ 
هذه المجموعات والمتغيّرات المشتقة بناءً على عدد من التجارب التي تم إجراؤها 
لعدد من الفرضيات المنطقية. وتم حفظ هذه التجارب والفرضيات في حزمة 
المتغير «dll‏ وهي التي رفعت مستوى الحساسية وأيضًا OSÍ‏ إلى الوصول إلى 
مستوى أفضل من دقة التنبؤ. تعكس الطبيعة الحقيقية للسكان (أيْ: الطلاب 
21 32( والمتغير التابع ("Second Fall Registered" x‏ والذي احتوى على 
الكثير من سجلات نعم (- (Ae‏ وسجلات لا )~ XY‏ انظر: الشكل «(o-Y‏ 

تظهر البحوث أن وجود مثل هذه البيانات غير المتوازنة يؤثر سلبيًا على أداء 
النموذج. ولذلك؛ cass‏ الدراسة خيارات استخدام ومقارنة نتائج نفس النوع 
من النماذج التي 6 بناؤها مع البيانات الأصلية غير المتوازنة (متحيّزة لسجلات 
(eso‏ والبيانات المتوازنة Je‏ 
النمذجة والتقييم: 

قامت الدراسة باستخدام أربع طرق تصنيف شائعة الاستخدام (أيْ: الشبكات 
العصبية الاصطناعية. وشجرات القرارء وآلة المتجهات الداعمة والانحدار 
اللوجستي) جنباً إلى جنب مع ثلاثة أطقم من تقنيات المجموعات النموذجية 
(أيْ: تعبشةء «ads‏ ودمج المعلومات). ثم ّت بعد ذلك مقارنة النتائج التي تمّ 
الحصول عليها من جميع أنواع النماذج بعضها مع بعض باستخدام طرق تقييم 
نموذج التصنيف المنتظم (مثل: الدقة التنبؤية الشاملة. الحساسية» النوعية) على 
عيّنات التحمّل. 
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نعم : ترك الدراسة.لا: مستمر فى الدرا: 











شكل :0-Y‏ تصوير lo‏ لمشكلة عدم توازن OUI‏ 

في خوارزميات ASI e das‏ (والتي سيم تغطية بعض منها في الفصل dE‏ 
As‏ تحليل الحساسية طريقة لتحديد علاقة ”السبب والنتيجة“ بين مدخلات 
ومُخرجات نموذج التنبق المعطى. iig‏ الفكرة الأساسية ehg‏ تحليل الحساسية أنه 
يقيس أهمية متغيرات التوقع على أساس التغيير في أداء النمذجة الذي يحدث إذا 
م يتم تضمين متغير توقع في النموذج. ويُطلّق على ممارسة النمذجة والتجارب 
هذه أيضًا مصطلح .(a leave-one-out assessment)‏ ومن ثم؛ فإن مقياس 
حساسية متغير تنبؤ aah‏ هو نسبة الخطأ في النموذج المدرّب بدون متغير 
التنبؤ إلى Lbs‏ النموذج الذي يتضمن متغير المتنبئ هذا. وكلما كانت الشبكة 
أكثر حساسية لمتغير معين» زاد انخفاصٌ الأداء في غياب هذا المتغيره ومن ثم زادت 
نسبة الأهمية. وبالإضافة إلى القوة التنبؤية للنماذج؛ فقد أجرت الدراسة أيضًا 
تحليلات الحساسية لتحديد الأهمية النسبية لمتغيرات الإدخال. 
النتائج: 

في المجموعة الأولى من التجارب» استخدمت الدراسة مجموعة البيانات 
الأصلية غير المتوازنة. واستنادًا إلى نتائج تقدير الصلاحية المتقاطع ذي ال 
٠‏ مراحل فقد أنتجت خوارزمية آلة المتجهات الداعمة (SVM)‏ أفضل دقة 
معدل تنبؤ إجمالي يبلغ ۸۷,۲۳ وجاءت شجرة القرار في المركز الثاني بمعدّل تنبؤ 
إجمالي قدره AV, VA‏ تليها الشبكات العصبية الاصطناعية معدل $53 إجمالي 
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6 ثم الانحدار اللوجستي معدل تنبؤ إجمالي قدره ۸1,١١‏ (انظر: الجدول 
(Y-Y‏ ويكشف الفحص الدقيق لهذه النتائج f‏ دقة التنبؤ لفئة ”نعم“ del‏ 
بشكل معنوي من دقة التنبؤ للفئة ”لا“. في الواقع؛ تنبأت جميع أنواع النماذج 
الأربعة بالطلاب الذين يرجح عودتهم للسنة الثانية بدقة تبلغ >1٠‏ لكنها (أيْ: 
النماذج) cols‏ بالطلاب المحتمل أن ينقطعوا عن الدراسة بعد عام دراسي جديد 
مستوى دقة لا يصل إلى ./6٠‏ ولأن التنبؤ بفئة ”لا“ هو الهدف الرئيسي من هذه 
الدراسة؛ فإن دقة أقل من odg) >0١‏ الفئة A‏ غير مقبولة. ومن الممكن (بل 
من الواجب) أن sj‏ مثل هذا الاختلاف في دقة التنبؤ للفئتين إلى الطبيعة غير 
المتوازنة مجموعة البيانات التدريبية (أي: - ×۸٠‏ ”نعم“ AY XY - ~g‏ 

TABLE 2.2 Prediction results for the Original/unbalanced Data set 








ANN(MLP) DT(C5) SW كا‎ 
No Yes No Ys No Ys No Ys 
No 1494 384 1518 304 1478 255 1438 376 
Yes 1596 1142 1572 11222 1612 11271 1652 — 11150 
SUM 3090 11526 3090 11576 3090 11526 3090 11526 
PerClass Accuracy — 48359 9067986 498136 930% 4838 9779% — 40544 974% 
Overall Accuracy 8645% 8716% 87123% 9612 





استخدمت الجولة التالية من التجارب مجموعة بيانات متوازنة؛ ]3 يتم تمثيل الفئتين 
بالتساوي تقريباً. وفي سبيل تحقيق هذا الأسلوب؛ أخذت الدراسة جميع العينات من 
فئة الأقلية (أيْ: الطبقة «لا») واختارت عشوائياً عدداً متساوياً من العينات من طبقة 
الأغلبية ssl)‏ الطبقة «نعم») وتمّ تكرارٌ هذه العملية ٠١‏ مرات لتقليل التحيّز ا محتمل 
للعينة العشوائية. وتمخّضمَّت كل عملية من عمليات أخذ العينات هذه عن مجموعة 
بيانات تضم ما يزيد عن ٠٠٠٠١‏ سجلء والتي تم فيها تمثيلٌ كلا الفئتين («نعم» و«لا») 
بالتساوي yo AU‏ 5,5« وباستخدام منهجية تقدير الصلاحية ذي ال ٠١‏ مراحل؛ 
قامت الدراسة بتطوير واختبار تماذج تنبؤ لجميع أنواع النماذج الأربعة. os‏ الجدول 
Y-Y‏ نتائج هذه التجارب. lug‏ على نتائج العينة المتحمّل عليها من قبل؛ قامت آلة 
المتجهات الداعمة $e‏ أخرى بإفراز أفضل معدل دقة للتنبؤ بشكل عام بنسبة ۸1,1۸ 
متبوعة بأشجار القرارء والشبكات العصبية الاصطناعية. والانحدار اللوجستي بمعدلات 
دقة تنب dale‏ تبلغ ZVE Y Vs AVIAC ۸٠,10‏ على الترتيب. وكما يتضح من معدلات 
الدقة لكلّ فئة؛ فإن نماذج التنبؤ كانت أفضل بشكلٍ معنوي في التنبق بفئة ”لا“ باستخدام 
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البيانات اممتوازنة a‏ بها عند استخدام البيانات غير المتوازنة. وبشكلٍ tele‏ كانت 
تقنيات elo‏ الآلة الثلاثة أفضل بكثير من نظيرتها الإحصائية الانحدار اللوجستي. 














[TABLE2.3 Prediction results for the balanced Data set 
Confusion ANNIMLP) DT(C5) SWM iR 
Matrix No es No 3 No » No Ns 
No 2309 44 Bn 417 2303 386 — 2125 — 626 
Ys 781 266 79 2673 77 20 %5 2464 
SUM 3090 3090 3090 3090 3080 3090 300 — 3090 
Perclass Accuracy nn $498 119% 8650 7485% 87151% 6877% 7974% 
Overall Accuracy 7985% 8065% 21 7426% 

















ةة 


بعد ذلك؛ تم tle]‏ مجموعة أخرى من التجارب لتقدي ر القدرة التنبؤية للنماذج 
الثلاثة. واستنادًا إلى نتائج تقدير الصلاحية المتقاطع ذي ال ٠١‏ أجزاء göl‏ نموذج مجموعة 
اندماج المعلومات أفضل النتائج بمعدل تنبؤ إجمالي يبلغ ۸۲,۱۰ ثم مجموعات من 
نوع التعبئة ومجموعات من نوع الدعم بمعدلات $25 إجمالية تبلغ 2۸1,۸۰ و١١٠۸‏ 
على التوالي (انظر: الجدول .)٤-١‏ وعلى الرغم من أن نتائج التنبؤات أفضل إلى &3 ما من 
لنماذج الفردية؛ فإنه من المعروف أن مجموعات النماذج تنتج أنظمة تنبؤ أكثر متانةٌ 
dis‏ بنموذج التنبؤ الأحادي (وسيتم توضيح ذلك بمزيد من التفصيل في الفصل 6). 

















TABLE 24 Prediction results for the three ensemble Models 
Boosting Bagging Information Fusion 
(Boosted Trees) (Random Forest) (Weighted Average) 
No Yes No Yes No Yes 

No 2242 ars 2327 362 2335 351 
Yes 848 2715 763 2728 755 2739 
SUM 3090 3090 3030 3090 3090 3090 
PerClass Accuracy 7256% 8786% 75318 88285 7557% 88.64% 

Overall Accuracy 8021% 81808 210% 








إضافة إلى تقدير دقة التنبؤ لكل نوع من أنواع النماذج؛ 65 be]‏ تحليل الحساسية أيضًا 
باستخدام نماذج التنبؤ المطوّرة لتحديد الأهمية النسبية للمتغيرات المستقلة sel)‏ المتنبئين). 
ولتحقيق نتائج تحليل الحساسية الشاملة؛ أنتج Js‏ نوع من أنواع النماذج الفردية الأربعة 
مقاييس حساسية خاصة به؛ بحيث تعمل على تصنيف جميع المتغيرات المستقلة في قائمة مرتبة 
بالأولوية. وكما هو متوقع؛ فقد أفرز JS‏ نوع من أنواع النماذج مراتب حساسية متفاوتة Ég‏ 
ما من المتغيرات المستقلة. وبعد جَمْع S‏ المجموعات الأربع من أرقام الحساسية؛ يتم توزيع 
أرقام الحساسية تلك توزيعًا طبيعيًا وتجميعها ورسمها في JS‏ بياني أفقي GS)‏ بالشكل .)١-۲‏ 
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الاستنتاجات: 


أظهرت الدراسة أن وجود بيانات كافية بمتغيّرات ملائمة يقود إلى أساليب استخراج 
بيانات لديها القدرة على التنبؤ بنسبة تسرب الطلاب الجُدد بدقة تصل إلى ZA‏ تقريبًا. 
كما أظهرت النتائج آنه وبغض النظر عن نموذج التنبؤ المُستّخدّم؛ فإن مجموعة البيانات 
المتوازنة (مقارنة بمجموعة البيانات غير ا متوازنة/ الأصلية) أنتجت نماذج أفضل في التنبؤ 
بالطلاب الذين من gbl‏ تسرّبهم من الكلية قبل سنتهم الدراسية الثانية. ومن بين نماذج 
التنبؤات الفردية الأربعة المُستخدّمة في هذه الدراسة: كان أداء آلة المتجهات الداعمة 
هو الأفضلء تليها أشجار القرارء ثم الشبكات العصبية, fools‏ الانحدار اللوجستي. UT‏ 
من زاوية سهولة الاستخدام؛ فعلى الرغم من حقيقة أن آلة المتجهات الداعمة أظهرت 
نتائج أفضل للتنبؤ؛ Ó‏ القائم بالتحليل قد يختار استخدام أشجار القرار؛ لأنها با مقارنة 
مع آلة المتجهات الداعمة والشبكات العصبية؛ فهي تصوّر هيكل نموذج أكثر شفافية. 
أيضًا تظهر أشجار القرار بشكلٍ واضح عملية استنتاج التنبؤات المختلفة؛ مما يوفر تبريرًا 
منطقيًا لنتائج معينةء في حين أن آلات ناقلات الدعم والشبكات العصبية الاصطناعية ما 
هي إلا نماذج رياضية لا piä‏ رؤية شفافة حول «كيف يفعلون ما يفعلون؟». 

أسئلة للمناقشة: 

-١‏ ما هو تسرب الطلاب» وماذا as‏ مشكلة مهمة في التعليم العالي؟ 

-Y‏ ماذا كانت الطرق التقليدية للتعامل مع مشكلة تسرب الطلاب؟ 

-Y‏ قم oo‏ ومناقشة التحَدَّيات المتعلقة بالبيانات في سياق دراسة هذه الحالة. 

-t‏ ماذا كان Jol‏ المقترح؟ وماذا كانت النتائج؟ 


Sources: Thammasiri, D., Delen, D., Meesad, P, & Kasap N. (2014). A critical 
assessment of imbalanced class distribution problem: The case of predicting 
freshmen student attrition. Expert Systems with Applications, 41(2), 321330-; Delen, 
D. (2011). Predicting student attrition with data mining methods. Journal of College 
Student Retention, 13(1), 1735-; Delen, D. (2010). A compara- tive analysis of 
machine learning techniques for student retention management. Decision Support 


Systems, 49(4), 498506-. 
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أسئلة مراجعة على القسم وك 
SU -١‏ لا تكون البيانات الأصلية/ الخام قابلة للاستخدام بسهولة؛ من خلال مهام التحليلات؟ 
-Y‏ ما الخطوات الرئيسية بلعالجة البيانات؟ 
-Y‏ ما المقصود ب تنظيف/ LAS‏ البيانات؟ وما الأنشطة التي ex‏ القيام بها في هذه المرحلة؟ 
IU, -é‏ نحتاج إلى تحويل البيانات؟ وما هي مهام تحويل البيانات شائعة الاستخدام؟ 
0- هكن تخفيض البيانات على الصفوف (أخذ العينات) و/ أو الأعمدة (اختيار متغير). أيهما أكثر تحديًا. 
0-٠‏ النمذجة الإحصائية لتحليلات الأعمال: 

بسبب تزايد رواج تحليلات الأعمال؛ فإن الطرق الإحصائية التقليدية والتقنيات الأساسية 

تستعيد أيضًا جاذبيتها كأدوات تمكينية لدعم guo‏ القرارات الإدارية المبنية على الأدلة. وهي 

بذلك y‏ تستعيد فقط الاهتمام والإعجاب» ولكنها (MI‏ تجذب مستخدمي الأعمال itol‏ إلى 
خبراء الإحصاء ومحترفي التحليلات. ole‏ ما 5 تعتبر الإحصائيات (الطرق الإحصائية والتقنيات 
الأماسية) جزءًا من التحليلات الوصفية (انظر: الشكل ۷-۲). كما هكن اعتبار بعض الأساليب 
الإحصائية Lf‏ جزءًا من التحليلات التنبؤية مثل تحليل التمايزء والانحدار المتعدد, والانحدار 
اللوجستي» k-means clustering‏ وكما هو موضّح في الشكل ۷-۲؛ فإن للتحليلات الوصفية 
فرعين رئيسين هما: الإحصاءات» ومعالجة التحليلات عبر الإنترنت OLAP 5j (OLAP)‏ 
هو المصطلح ا مستخدّم لتحليل وتوصيف وتلخيص البيانات المهيكلة المخرّنة في قواعد البيانات 
التنظيمية (غالباً ما يتم تخزينها في مستودع البيانات أو في سوق البيانات» وسيتمٌ تغطية 
تفاصيل مستودعات البيانات في الفصل (Y‏ باستخدام مكعبات ssl)‏ هياكل بيانات مُتعدّدة 
الأبعاد والتي يتم إنشاؤها لاستخراج مجموعة فرعية من قيم البيانات للإجابة عن سؤال أعمال 
معين). كما أطلق على فرع OLAP‏ للتحليل الوصفي اسم ذكاء الأعمال. من ناحية أخرى؛ 
تساعد الإحصائيات في توصيف البيانات G)‏ على متغير واحد في JS‏ مرة أو متغيرات متعددة 
dza‏ باستخدام إما أساليب وصفية أو استنتاجية. 
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شكل :V-Y‏ العلاقة بين الإحصاء والتحليلات الوصفية 

كانت الإحصائيات - وهي مجموعة من التقنيات الرياضية لتوصيف وتفسير البيانات - موجودةٌ 
منذ C5‏ طويل. وقد تم تطوير العديد من الأساليب والتقنيات لتلبية احتياجات ا مستخدمين 
النهائيين ومعالجة الخصائص الفريدة للبيانات التي يتم تحليلها. وبشكل عام وعلى أعلى مستوى» 
فيمكن تصنيف الأساليب الإحصائية على أنها إما وصفية أو استنتاجية. ويكمُّنْ الفرق الرئيس 
بين الإحصاء الوصفي والاستنتاجي في البيانات المُستخدّمة في هذه الطرق - في حين يقوم الإحصاء 
الوصفي على وصف بيانات العينة oll‏ تتعلق الإحصاءات الاستقصائية برسم استدلالات أو 
استنتاجات حول خصائص السكان. وسنقوم إيجارًا في هذا القسم» بوصف الإحصائيات الوصفية 
(لأنها بالفعل تضع حجر الأماس للتحليلات الوصفيةء وعد كذلك الجزء الأساسي منها» أما في 
القسم التالي؛ فسنغطي الانحدار (بنوعيه الخطي واللوجستي) كجزء من الإحصاءات الاستدلالية. 


الإحصاء الوصفي للتحليلات الوصفية: 


تُوضّح الإحصائية الوصفيةء كما يُوحي الاسم» الخصائص الأساسية للبيانات المتحصّل عليهاء 
وغالبًا ما يكون هناك متغيرٌ واحدٌ في كل مرة. وباستخدام المعادلات وا مجموعات العددية, 
تستطيع الإحصاءات الوصفية تلخيص البيانات بطريقة تؤدي في الغالب إلى الخروج من الدراسة 
بأماط سهلة الفهم وذات معنى. وعلى الرغم من أن الإحصاء الوصفي مفيدٌ جدًا في تحليلات 
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البيانات» وأيضًا له الرّواجٍ الأعلى في الاستخدام بين الأساليب الإحصائية؛ فإنه لا يسمح بعمل 
استنتاجات (أو استدلالات) تتجاوز عينة البيانات التي يتم تحليلها. xl‏ إنه ببساطة يُعَدُ 
طريقةً Base‏ لتوصيف ووصف البيانات المتاحةء دون الحصول على استنتاجات (الاستدلالات 
أو الاستقراءات)؛ وذلك فيما يتعلق بسكان الفرضيات ذات الصّلة التي قد نضعها في الاعتبار. 
ds‏ تحليلات الأعمال؛ تلعب الإحصائيات الوصفية go‏ حساسًا - فهي تتيح لنا فهم وشرح/ 
تقديم بياناتنا بطريقة هادفة باستخدام الأرقام المجمّعة أو جداول البيانات أو الخرائط/ الرسوم 
البيانية. ds‏ جوهر الإحصائيات الوصفية؛ فهي تساعدنا على تحويل الأرقام والرموز التي بأيدينا 
إلى تمثيلات ذات معنى يستطيع أي شخص أن يفهمها ويستخدمها بسهولة. لا يساعد هذا 
الفهم مستخدمي الأعمال في عمليات guo‏ قراراتهم فحسب؛ بل يساعد كذلك محترفي التحليلات 
وعلماء البيانات على توصيف واختبار صلاحية البيانات مهام تحليلية أخرى أكثر تعقيدًا. كما 
يسمح الإحصاء الوصفي للمحللين بتحديد التنسيق «data concertation‏ وكذلك القيم الكبيرة 
أو الصغيرة غير المعتادة (أيْ: القيم المتطرفة)» وقيم البيانات المورّعة بشكلٍ غير متوقع للمتغيرات 
الرقمية. ولذلك؛ فيمكن تصنيف الطرق في الإحصاء الوصفي إما كمقاييس للميل المركزي أو 
مقاييس للتشتت. وسنستخدم في القسم التالي وصفًا بسيطًا وصياغة رياضية/ تمثيلًا رياضيًا 
لهذه المقاييس. في التمثيل الرياضي؛ سنستخدم es. Y oo Vou Agu‏ سين لتمثيل القيم المنفردة 
(الملاحظات) للمتغير (قياس) الذي نحن بصدد توصيفه. 


مقاييس النزعة المركزية (كما يمكن أن يُطلق عليها مقاييس الموقع, أو المقاييس المركزية): 
d‏ المقاييس المركزية؛ هي الطرق الرياضية التي نستخدمها في تقدير ووصف الوضع المركزي 
للمتغير المعطى محل الدراسة. iig‏ مقياس الاتجاه ا مركزي Éad‏ عددية مفردةٌ تهدف إلى 
وصف مجموعة من البيانات؛ من خلال تحديد أو تقدير الموقع المركزي ضمن البيانات بوضوح. 
dais‏ المتوسط (والذي يُطلق عليه غالبًا الوسط الحسابي أو المتوسط البسيط). هو المقياس الأكثر 
استخدامًا للاتجاه المركزي. بالإضافة إلى المتوسطء من الممكن أيضًا استخدام الوسيط أو المنوال 
المُستَخدّم لوصف المركزية للمتغير المعطى. وعلى الرغم من أن الوسط الحسابي والوسيط والمنوال 
كلها مقاييس صحيحة للاتجاه المركزي؛ فإنه في بعض الحالات ووفقًا لظروف معينةء تكون إحدى 
هذه المقاييس أكثر ملاءمةً من الأخرى. وفيما يلي أوصاف مختصرة لهذه المقاييس» Le‏ في ذلك 
كيفية حسابها رياضيًا مع الإشارة إلى الظروف التي تجعل أحدها أنسب في الاستخدام من غيره. 
- الوسط الحسابي: (أو المتوسط البسيط أو المعدل) هو مجموع S‏ القيم/ الملاحظات مقسومًا على 
عدد تلك الملاحظات في حزمة البيانات. وهو إلى 55 بعيد Ass‏ الأكثر رواجًا وشيوعًا في قياس النزعة 
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المركزية. 925 استخدامه مع بيانات رقمية مستمرة أو منفصلة. بالنسبة للمتغير سء إذا حصلنا 
على عدد ن من القيم/ الملاحظات Ye ds)‏ س۳ ..» س ن)؛ فيمكننا كتابة الوسط الحسابي لعينة 
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يمتلك الوسط العديد من الخصائص الفريدة؛ فعلى سبيل المثال: يكون مجموع الانحرافات 
المطلقة (الفروق بين الوسط الحسابي والقيم) فوق الوسط هي نفس مجموع الانحرافات التي 
تحت الوسط مع مراعاة توازن القيم في كلا الجانبين. ومع eUS‏ فإن هذا لا يعني أن نصف 
عدد القيم يكون أعلى الوسط الحسايء والنصف الآخر أقل منه (فهذا اعتقادٌ خطأ شائعٌ بين 
أولئك الذين لا يعرفون الإحصائيات الأساسية). وأيضًا as‏ الوسط مقياسًا فريدًا لكل مجموعة 
بيانات» وله das osa‏ للحساب لكل ما يتعلق بالبيانات والفترات العددية. ads‏ أحد أكثر 
العيوب الرئيسة في الوسط الحسابي؛ هو تأثره بالقيم المتطرفة (القيم التي تكون أكبر أو أصخر 
بكثير من بقية نقاط البيانات). إذ تقوم القيم المتطرفة بسحب الوسط dogas‏ وبالتالي يحدث 
jia‏ في التمثيل المركزي. ولذلك؛ في حالة وجود قيم متطرفة أو إذا كانت البيانات مبعثرة 
ومنحرفة بطريقة عشوائية؛ فيجب على المحلل cot‏ استخدام الوسط الحسابي كمقياس 
مركزي أو إضافته مع مقاييس النزعة المركزية الأخرى مثل: الوسيط والمنوال. 
- الوسيط: هو مقياس لقيمة المركز في حزمة البيانات المعطاة. ssl‏ هو الرقم الواقع في وسط 
مجموعة معينة من البيانات التي 3( ترتيبها / فرزها حسب حجمها (إما تصاعديًا أو (ÉL‏ 
إذا كان Sae‏ القيم رقمًا فرديًا؛ فإن تحديد الوسيط سهل للغاية - فقط قم بفرز القيم Uo‏ على 
قيمها واختر القيمة الصحيحة التي في الوسط lr‏ أما إذا كان عدد القيم رقمًا زوجيًا؛ فقم 
بتحديد القيمتين الواقعتين في المنتصفء ثم خذ المتوسط البسيط لهاتين القيمتين. AS‏ الوسيط 
Glas‏ وقابلاً للحساب لأنواع معينة من البيانات كالنُّسبء والفترات الفاصلة» والبيانات الترتيبية. 
وبمجرد تحديد الوسيطء يكون نصف عدد البيانات في الأعلى منه والنصف الآخر أدناه. وعلى 
عكس الوسط aed!‏ لا يتأثر الوسيط بالقيم المتطرفة أو البيانات المنحرفة. 
- المنوال: هو القيمة التي تحدث بشكل متكرر (القيمة الأكثر تكرارًا في مجموعة البيانات). Gus‏ 
تمثيله على الرسم البياني بالعمود «didus AEI‏ هكن اعتباره الخيار/ القيمة الأكثر شيوعًا. 
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ويكون المنوال مفيدًا lia‏ في حالة مجموعات البيانات التي تحتوي على عدد صغير نسبيًا من 
القيم الفريدة. أي إنه قد يكون عديم الفائدة إذا كانت البيانات تحتوي على الكثير من القيم 
الفريدة LS)‏ هو الحال في العديد من القياسات الهندسية ذات الدقة العالية والعدد الكبير 
من الخانات العشرية)؛ مما يجعل JS‏ قيمة تحتوي على رقم واحد تمثل تكرارًا خاضًا بها. وعلى 
الرغم من كونه مقياسًا مفيدًا (خاصة للبيانات الاسمية)؛ فإنه لا هثل المركزية بصورة جيدة؛ 
ولذلك Y‏ ينبغي استخدامه كمقياس وحيد desi‏ ا مركزية لمجموعة بيانات معينة. 
باختصار؛ أي من مقاييس الاتجاه المركزية يعد الأفضل؟ في الواقع لا تُوجّد هناك إجابةٌ 
واضحةً لهذا السؤال؛ ولكن هناك بعض الإشارات نعرض لها فيما يلي: استخدم الوسط الحسابي 
عندما لا تكون البيانات ميّالة للقيم المتطرفة وليس بها انحرافات معنوية؛ استخدم الوسيط 
عندما تكون بالبيانات قيم متطرفة و/ أو أن تكون بطبيعتها بيانات ترتيبية؛ استخدم المنوال 
عندما تكون البيانات اسمية. ولعل أفضل هذه الممارسات هو استخدام S‏ هذه المقاييس الثلاثة 
معّا؛ بحيث يكن الوصول للاتجاه ا مركزي لمجموعة البيانات» وتمثيله من وجهة نظر JS‏ مقياس 
على حِدّة. ولأن Jàs‏ ”أو ا متوسط“ هو يكون غالبًا مفهومًا مألوقًا للغاية ومُستَخدَمًا بشكلٍ 
aS‏ للجميع في الأنشطة اليومية المتكرّرة بانتظام؛ فغالبًا ما يستخدم ال مديرون (وكذلك بعض 
العلماء والصحفيين) المقاييس المركزية (خاصة الوسط الحسابي) بشكلٍ غير ملائم خاصةٌ عندما 
يستلزم الأمر التعامل مع المعلومات الإحصائية الأخرى من منظور المركزية. ومن الأفضل تقديم 
إحصائيات وصفية كحزمة - عبارة عن مزيج من مقاييس مركزية Èisg‏ - في مقابل مقياس 
واحد مثل الوسط الحسابي. 


مقاييس uaig) các!‏ أيضًا مقاييس الانتشار أو الامتداد): 

AÉ‏ مقاييس التشّت هي الطرق الرياضية المُستَخدّمة لتقدير أو وَضْف درجة التباين في ا متغير 
المعطى الذي يكون محل الدراسة. وهي تمثل الانتشار الرقمي (الاكتناز أو (doss‏ لمجموعة البيانات 
المعطاة. ولوصف هذا التشتتء تم تطوير عدد من المقاييس الإحصائية؛ وأبرزها: النطاق» والتباين» 
والانحراف ال معياري (وكذلك الربيعات» والانحراف المطلق). kt‏ أحد الأسباب الرئيسية وراء أهمية 
مقاييس 23 E‏ انتشار قيم OBLI‏ هو أنه يمنحنا إطارًا هكننا من خلاله الحكم على النزعة 
المركزية - وذلك ob‏ يعطينا إشارةً d!‏ مدى جودة الوسط الحساي (أو المقاييس المركزية الأخرى) 
عند تمثيل بيانات العينة. وإذا كان cias LÉS‏ القيم في مجموعة البيانات PS‏ فلا بعر الوسط الحسابي 
تمثيلًا Fus‏ للبيانات. وذلك OS‏ قياس التشئّت الكبير يشير إلى اختلافات كبيرة بين الدرجات المنفردة. 
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وفي البحث أيضّاء UI‏ ما is‏ إليه على أنه علامة إيجابية لرؤية تباين صغير داخل JS‏ عينة بيانات؛ 

إذ إنه قد يشير إلى التجانس, والتشابهء والمتانة ضمن البيانات التي تم جمعها. 

- النطاق: قد يكون النطاق أبسط مقياس للتشتت. والنطاق هو الفرق بين أكبر قيمة وأصغر 
قيمة في مجموعة البيانات المعطاة (أيْ: ا متغيرات). أي إننا نحسب النطاق ببساطة عن طريق 
تحديد أصغر قيمة في مجموعة البيانات (الحد (JÄI‏ وتحديد أكبر قيمة في مجموعة البيانات 
(الحد الأقصى). وحساب الفرق بينهما أيّ: (النطاق = الحد الأقصى - الحد الأدنى). 

- التباين: هو مقياسٌ أكثر شمولًا Cii lass‏ ويُستخدّم التباين لحساب انحراف جميع نقاط 
البيانات في مجموعة البيانات المعطاة عن الوسط الحساي. وكلما كان التباين أك زاد انتشار 
(تششّت) البيانات عن الوسط وأيضًا lae olj‏ بالشكل الذي يسمح لأيّ شخص ملاحظته في عينة 
البيانات. ونع اختلاط الفروق السلبية والإيجابيةء يأخذ التباين مربع المسافات من الوسط الحسابي 
في الاعتبار. وهكن dS‏ معادلة عينة البيانات كالتالي: (يتم استبدال GO JS‏ ب س» وکل (n)‏ ب ن) 


es Xu »‏ و 
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حيث ن هي حجم iial‏ وس (عليها شرطة) هو الوسط الحساي للعينة 
وس (بجوارها i‏ صغيرة) هو القيمة ذات الترتيب (1) في العينة. تشير قيمٌ التباين الأكبر إلى مزيد 
من SCA all‏ في حين تشير القيم الأصغر إلى انضغاط نقاط البيانات في حزمة البيانات الكلية. 
ونظرًا لأن الفروق مربعة؛ OB‏ الانحرافات الأكبر عن الوسط الحسابي تُسهم بشكل معنوي في 
قيمة التباين. مرةً 5,51« ونظرًا لأن الفروق مربعة؛ فإن الأرقام التي تمثل الانحراف/ التباين 
تصبح غير ذات معنى إلى S6‏ ما (في مقابل الفرق بالدولارء وهنا يتم الحصول على فرق مربع 
للدولار). لذلك؛ ففي العديد من تطبيقات الأعمال لا نستخدم التباين كمقياس aZ aal]‏ 
ونستعيض عنه بمقياس آخر يعطي CiN‏ معنّى أفضلء ويُسمّى الانحراف المعياري. 
- الانحراف المعياري: هو أيضًا مقياسٌ لانتشار القيم ضمن مجموعة من البيانات. ويتم حسابه 
ببساطة عن طريق أخذ الجذر التربيعي للتغيرات. وتوضّح الصيغة التالية حساب الانحراف 
ا معياري من عينة معينة من نقاط البيانات: (يتم استبدال G9 JS‏ ب سء وکل (م) ب ن) 
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- متوسط الانحراف المطلق: fla,‏ إلى التباين والانحراف ال معياري نستخدم Ud‏ في بعض 
الأحيان متوسط الانحراف المطلق لقياس Có cll‏ في مجموعة البيانات. da.‏ استخدام هذا 
المقياس طريقة أبسط لحساب الانحراف الإجمالي عن الوسط الحسابي. deg‏ وجه التحديد 
يتم حساب متوسط الانحراف المطلق من خلال قياس القيم المطلقة للفروق بين كل نقطة 
من نقاط البيانات والوسط الحسايء ثم جمع تلك القيم. ويوفّر ذلك مقياسًا للانتشار دون 
أن يكون محددًا حول نقطة بيانات تكون أدنى أو أعلى من الوسط الحساي. وتوضّح الصيغة 
التالية حساب متوسط الانحراف المطلق: 
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- الربيعات والنطاق الزبيعي: تساعدنا Oleg dh‏ على تحديد الانتشار داخل مجموعة فرعية 
من البيانات. ويش كل ge‏ ربع عدد نقاط البيانات المعطاة في مجموعة البيانات. ولتحديد 
الرُبيعات يتم أولا ترتيب البيانات» ثم بعد ذلك يتم تقسيم تلك البيانات المرتبة إلى gl‏ 
مجموعات بيانات أصغر منفصلة بعضها عن بعض. Aso‏ البيعات مقياسًا مفيدًا sc caa‏ 
لأنها - مقارنة بالمقاييس المناظرة الأخرى - أقل تأثرًا بالقيم المتطرفة أو الانحرافات في مجموعة 
البيانات بالكامل. وغالبًا ما يتم استخدام الرُبيعات كأفضل خيار لقياس التشتّت كما يتم اعتبار 
الوسيط هو مقياس Catal‏ الأنسب لقياس الاتجاه المركزي؛ وذلك عند التعامل مع الانحراف و/ 
أو البيانات ذات القيم المتطرفة. ÓL‏ الطريقة الشائعة للتعبير عن الرُبيعات هي النطاق )5941( 
الرُبيعسيء والتي تصف الفرق بين الربيع الثالث (Q3)‏ والربيع الأول (QI)‏ وهذا الفرق يعطي 
Y‏ على مدى النصف الأوسط من الدرجات في التوزيع. وَيُحَدُ أفضل شرح أو توضيح للمقاييس 
الوصفية امستندة على الرُبيعات (سواء كانت مقاييس مركزية أو مقاييس تشتت) هو وجود 
ما 45,5( «popular plot‏ والذي glk;‏ عليه أيضًا a box plot‏ أو -(box-and-whiskers plot)‏ 
- مُخطط الصندوق وطرفاه Box-and-Whiskers Plot‏ أو ببساطة الرسم الصندوقي a box plot‏ هو 
e)‏ بياني يُوضّح العديد من الإحصائيات الوصفية حول مجموعة البيانات اللعطاة. ومن 
الممكن أن يكون هذا الرسم إما أفقيًا أو Eais‏ ولكن الرأسي هو التمثيل الأكثر شيوعًا؛ خاصة 
في منتجات برمجيات التحليلات الحديثة. ومن ا معروف أنَّ أول مَنْ أنشأ هذا المخطط وقدّمه 
هو John W. Tukey‏ في عام ees Y‏ الشكل A-Y‏ زوجين من e box plots‏ إلى 
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جنب» يتشاركان نفس المحور Y‏ (أو ص على حسب الطباعة للشكل). كما هو موضح La‏ 
يمكن أن يحتوي مخططاً واحداً على box plot‏ واحداً أو ssl‏ لأغراض المقارنة ال مرئية. في مثل 
هذه الحالات؛ يكون المحور y‏ (أو ص على حسب الطباعة للشكل) هو المقياس الشائع للحجم 
(القيمة العددية للمتغير)» في حين يُعبّر المحور السيني (أو (x‏ عن فئات مختلفة/ مجموعات 
فرعية مختلفة كالأبعاد الزمنية المتفاوتة (مثل: إحصائيات وصفية لنفقات الرّعاية الطبية 
السنوية في عام ١٠١۲م‏ مقابل عام 17١7م)‏ أو فئات مختلفة (مثل: الإحصاء الوصفي لنفقات 
التسويق مقابل إجمالي المبيعات). وعلى الرغم من أنه تاريخيًاه لم يتم استخدام box plot‏ على 
نطاق واسع ها يكفي في الغالب (وخاصة في المناطق خارج الإحصاءات)» ومع الرّواج الحاصل 
لتحليلات الأعمال الناشئة؛ فإنه (أيْ: (box plot‏ يكتسب الشهرة في المجالات الأقل تقنيةٌ في 
عام الأعمال. ويؤدي ثراء ا معلومات الناتجة من box plot‏ وأيضًا سهولة فهمها إلى 35 كبير 
إلى زيادة الثقة فيه ورواج استخدامه في الآونة الأخيرة. 353« plot‏ ×0ط المركزية (الوسيط 
وأحيانًا أيضًا الوسط الحسابي)ء وكذلك BLS) cola‏ البيانات في النصف الأوسط والمرسومة 
كصندوق بين الربعين الأول والثالث)» والحدان الأدنى والأقصى (والموضحة كخطوط ممتدة من 
الصندوق» تبدو كالشوارب» والتي يتم حسابها على أنها Vo‏ أضعاف الطرف العلوي أو السفلي 
من الصندوق الرُبيعي) إلى جانب القيم الشاذة الأكبر من حدود الشوارب. يوضّح box plot‏ 
Lad‏ ما إذا كانت البيانات مُورّعة بشكل losa‏ فيما يتعلق بالوسط الحسابي أو أنها تنمايل 
بطريقة أو بأخرى. ويعطي الموضع النسبي للوسيط مقابل الوسط الحسابي وأطوال الشعيرات 
الممتدة على جانبي الصندوق Sau dI»‏ على الانحراف المحتمل في البيانات. 
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شكل :A-Y‏ فهم التفاصيل عن مخططات Box-and-Whiskers‏ 


شكل التوزيع: 

على الرّغم من أنه ليس شائعًا مثل المركزية والتشتت؛ فإن شكل توزيع البيانات Ud s‏ مقياسًا 
مفيدًا للإحصاءات الوصفية. ولكن قبل الخوض في شكل التوزيع؛ نحتاج Vol‏ إلى تعريف التوزيع 
نفسه. ببساطة نقول: إِنَّ التوزيع هو تكرار نقاط البيانات التي يتم حسابها ورسمها على عدو صغيرٍ 
من العلامات الفئوية أو النطاقات العددية (أيْ: صناديق التخزين). وعند رسم التوزيع Gly‏ يعرض 
ا محور y‏ (أو ص) التكرار (عدد أو نسبة مئوية)» في حين يعرض المحور x‏ (أو س) الطبقات المنفردة 
أو الصناديق بنمط ترتيبي. GÀ ad‏ التوزيع المعروف جيدًا بالتوزيع الطبيعيء والذي يتطابق Gle‏ 
على كلا جانبي الوسط الحساي» ويحتوي التوزيع الطبيعي على العديد من الخصائص الرياضية التي 
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تم إنشاؤها بشكلٍ جيد والتي تجعله l> Sugio Slo]‏ للبحث والممارسة. وكلما LAS olj‏ مجموعة 
البيانات؛ زاد الانحراف المعياريء وكذلك يبدو شكل التوزيع أعرض. يعرض الشكل ٩-۲‏ رسماً بيانياً 
للعلاقة بين التشثّت وشكل التوزيع (وذلك في سياق الكلام عن التوزيع الطبيعي). 
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شكل :A-Y‏ العلاقة بين التشتت وخصائص الشكل 
يُوجّد نوعان من المقاييس الشائعة الاستخدام لحساب خصائص JS‏ التوزيع وهما: الانحراف 
والتفرطح. وغالبًا ما يستخدم الرسم البياني (مخطط التكرار) لتوضيح S‏ من الانحراف والتفرطح. 
- الانحراف: هو قياس لعدم التماثل (التمايل) في توزيع البيانات التي تصوّر هيكلاً أحاديّ الشكل 


5 


- في هذا التوزيع للبيانات تُوجّد قمة واحدة فق ط. ولأن التوزيع الطبيعي هو توزيعٌ أحاديٰ 
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الشكل متماثلٌ dU‏ فلا 2295 به انحرافات؛ أي l‏ قياس الانحراف (أو قيمة معامل الانحراف) 
يساوي الصفر. ويمكن أن يكون قياس/ قيمة الانحراف إما بالموجب أو بالسالب. إذا مال التوزيع 
ناحية اليسار (أي إِنَّ الذيل على الجانب الأيمن وكان الوسط الحسابي أصغر من الوسيط)؛ فإنه 
ينتج عنه مقياس انحراف موجب. أما إذا مال التوزيع ناحية اليمين (أي ÓL‏ الذيل على الجانب 
الأيسر وكان الوسط الحسابي أكبر من الوسيط)؛ فعندئذ يكون الانحراف سالباً. فضي الشكل ٩-۲‏ 
Jig‏ المنحنى (C)‏ توزيعًا منحرفًا dirga‏ في حين يمثل المنحنى (d)‏ توزيعًا منحرفًا سالبًا. ds‏ نفس 
الشكلء JS Uie‏ من (b)s (a)‏ تمائلاً مثالياً وبالتالي قياس الانحراف يساوي صفر. 
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حيث s‏ هو الانحراف ا معياري» وه هي حجم العينة. 

- التفرطح: هو مقياسٌ آخر لاستخدامه في تحديد خصائص شكل التوزيع الأحادي. وبغض النظر 
عن ميل شكل التوزيع؛ ÓB‏ التفرطح أكثر اهتمامًا بتمييز طبيعة التوزيع من حيث القمة/ 
الطول/ النحافة. وبشكل أكثر تحديدًا؛ ف ان التفرطح يقيس درجة ارتفاع أو انخفاض قمة 
التوزيع عنها في التوزيع الطبيعي. في حين يشير التفرطح الموج ب إلى توزيع مدبب/ طويل 
e a‏ ويشير التفرطح السّلبي إلى توزيع مسطح/ قصير نسبيًا. وكنقطة مرجعية؛ فإن التوزيع 
الطبيعي له تفرطح Y‏ ويمكن كتابة معادلة التفرطح كالتالي: 








I‏ الإحصائيات الوصفية (شأنها شأن الإحصائيات الاستنتاجية) هكن حسابها بسهولة؛ 
وذلك باستخدام حزم برمجية إحصائية ذات جدوى تجارية (مثل: SAS‏ أو SPSS‏ 
أو Minitab‏ أو JMP‏ أو (Statistica‏ أو البرامج المجانية/ المفتوحة (مثل: (R‏ ولعل الطريقة 
fod ASSI‏ لحساب الإحصائيات الوصفيةء وبعض الإحصائيات الاستنتاجية هو استخدام 
جداول الإكسل. وتوضّح الفكرة التقنية VY‏ بالتفصيل كيفية اس تخدام جداول مايكروسوفت 
إكسل لحساب الإحصائيات الوصفية. 
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رؤية فنية ١-۲‏ 

كيفية حساب الإحصائيات الوصفية باستخدام جداول مايكروسوفت إكسل 

هكن القول بأن برنامج إكسل يُعَنُ أداة تحليل البيانات الأكثر شيوعًا في العالم, كما 
يمكن استخدامه بسهولة بالنسبة للإحصاءات الوصفية. وعلى الرغم من أن التكوين 
الأماسي لبرنامج إكسل لا يُوحي أن به دوال إحصائية متاحة للمستخدمين النهائيين؛ 
فإنَّ هذه الدوال يمكن تثبيتها وتنشيطها (عند التشغيل) بالقليل فقط من نقرات 
الماوس. ويوضّح الشكل ٠١٠١‏ كيفية تنشيط هذه الدوال الإحصائية eje)‏ من تحليل 
(ToolPak‏ في مايكروسوفت إكسل YNI‏ 
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شكل :٠١-7‏ تفعيل الدوال الإحصائية في إكسل 7١1١5‏ 
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وبمجرد تفعيل الدوال الإحصائية؛ سيظهر تحليل ToolPak‏ في خيار قانمة البيانات 
(Data)‏ تحت اسم تحليل البيانات (Data Analysis)‏ وعند النقر فوق ”تحليل 
البيانات أو "(Data Analysis)‏ في مجموعة ”التحليل أو "(Analysis)‏ تحت علامة 
التبويب ”البيانات أو  " (Data)‏ شريط قوائم إكسلء ستشاهد ”الإحصائيات الوصفية 
أو "(Descriptive Statistics)‏ كأحد الخيارات الموجودة ضمن قائمة أدوات تحليل 
البيانات (انظر: الشكل A-Y‏ الخطوات s([Ys V]‏ انقر فوق ”موافق أو (OK)‏ 
وسيظهر مربع حوار بعنوان ”الإحصائيات الوصفية "(Descriptive Statistics)‏ (انظر: 
منتصف الشكل .)١١-۲‏ في مربع الحوار Jia‏ تحتاج إلى إدخال نطاق البيانات» والتي 
يمكن أن يتم تمثيلها بواحدٍ أو أكثر من الأعمدة الرقميةء إلى جانب مربعات فحص 
التفضيلات. وانقر فوق OK‏ (انظر: الشكل Y V-Y‏ الخطوات Y]‏ وع]). ]15 تمّ تظليل 
(Selection)‏ أكثر من عمود رقمي واحد؛ فستقوم الأداة بمعالجة JS‏ عمود على أنه 
مجموعة Olly‏ منفصلة. ومن 3 ستُقدم إحصائيات وصفية لكل عمود على Báo‏ 
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شكل :1١-7‏ الحصول على الإحصائيات الوصفية في برنامج إكسل 
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: وكمثالٍ بسيط LAS‏ عمودين )63 وضع عنوانين لهما: مصاريف وطلبات) 
ونفذنا خيار الإحصاء الوصفي (Descriptive Statistics)‏ يُوضح الجزء السفلي 
من الشكل ١١-۲‏ المخرجات التي تم إنشاؤها بواسطة إكسل. وكما يتضح؛ أنتج 
إكسل جميع الإحصائيات الوصفية التي تمت تغطيتها في القسم السابق: وإضافة 
المزيد منها إلى القائمة. وفي إكسل ۲١٠١‏ من السهل جدًا أيضًا dali)‏ من نقرات 
الماوس) أن يتم إنشاء .a box-and-whiskers‏ كما óg‏ الشكل W-Y‏ العملية 
البسيطة و مكونة من ثلاث خطوات لإنشاء abox-and-whiskers‏ في إكسل. 
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شكل :M-Y‏ إنشاء مخطط Box-and-Whiskers‏ في إكسل ۲۰۱٦‏ 
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وعلى الرغم من Ol‏ هذه الأداة Baud AS‏ جدًا في إكسل؛ فإنه يتحتّم على 
المحلّل أن يكون lo‏ بنقطة مهمة تتعلق بالنتائج المتحصّل عليها بواسطة تحليل 
 ToolPak‏ والتي تنتهج سلوكًا مختلقًا عن وظائف الإكسل الأخرى المعتادة. 
وعلى الرغم من أن وظائف إكسل تتغيّر ديناميكيًا مثلما تتغبّر البيانات الأساسية 
في جدول البيانات؛ فإنه لا يتم تغيير النتائج التي تم إنشاؤها بواسطة تحليل 
-ToolPak‏ وعلى سبيل المثال: إذا قمتَ بتغيير القيم في isl‏ من هذين العمودين 
أو كليهما؛ فس تبقى نتائج الإحصائيات الوصفية التي أنتجها تحليل ToolPak‏ 
كما هي دون تغيير. ومع ذلك؛ لا ينطبق الأمر نفسه على وظائف إكسل المعتادة. 
إذا Ca‏ قد قم بحساب قيمة الوسط الحساي لعمود ما (باستخدام الدالة 
(AVEREGE‏ للنطاق من (AT:AT21)‏ ثم قم بتغيير القيم داخل نطاق 
البيانات؛ فسوف تتغير قيمة الوسط الحسابي تلقائيًا. أي إنه باختصار, لا تحتوي 
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النتائج التي ينتجها تحليل ToolPak‏ على رابط ديناميي للبيانات الأساسية؛ وإذا 
تم تغيير أيّ بيان؛ فيجب إعادة التحليل foa‏ أخرى باستخدام مربع الحوار. 

تغطي التطبيقات الناجحة لتحليلات البيانات نطاقًا واسعًا من إعدادات 
الأعمال والتنظيمات» ومعالجة المشكلات التي كان يُعتقد في السابق أنها غير قابلة 
للحل. وتمثل الحالة العملية YY‏ مثالا la‏ لهذه القصص الناجحة؛ إذ تتبَنّى 
إدارة بلدية صغيرة منهج تحليل البيانات لكشف وحل المشكلات بذكاء من خلال 
تحليل أنماط الطلب والاستهلاك بشكلٍ مستمر. 


حالة عملية Y-Y‏ 
مدينة كاري تستخدم التحليلات لتحليل البيانات من أجهزة الاستشعارء وتقييم الطلب 
والكشف عن المشكلات 

OL‏ تسرب المياه من الحنفيات, والخلل بغسالة الصحون» وطفايات الحريق المكسورة؛ 
dos‏ من أكثر المشكلات المؤرقة لأَيّ مالك منزل أو ممارس لأع مال تجارية إلى أن &x‏ 
إصلاحها. وهذه المشكلات قد تكون مكلفةً ولا هكن التنبؤ بهاء وللأسفء يكون من 
الصعب تحديدهها. وقد تمّ تسهيل عملية اكتشاف وإصلاح المشكلات التي تؤدي إلى 
نقصان أو فقدان الماء في مدينة كاري بشمال كارولينا؛ وذلك من خلال مجموعة من 
عدّادات اطياه اللاسلكية وبوابة إلكترونية معتمدة على البيانات يسهل الوصول إليها 
بواسطة جميع العملاء. في هذه العملية. حصلت المدينة على رؤية ذات صورة كبيرة 
عن حساسية استخداع المياه؛ وذلك لتخطيط cols os‏ في محطات المياه المستقبلية, 
وتعزيز جهود الصيانة المُستَهدّفة. عندما قامت مدينة كاري بتثبيت العدّادات اللاسلكية 
لعدد 7٠٠٠١‏ مشترك في عام te^ V.‏ علمت إدارة البلدة Í‏ التقنية الجديدة لن تقتصر 
على توفير امال عن طريق إزالة القراءات الشهرية t so‏ بل أدركت المدينة Uo‏ أنها 
ستحصل على معلومات أكثر »4 وفي الوقت المناسب حول استهلاك colt‏ يقرأ النظام 
اللاملكي Aquastar‏ العدّادات $52 واحدة S‏ ساعة؛ مما يعني الحصول على ۸۷1١‏ 
نقطة بيانات JS)‏ عميلٍ كل عام بدلا من قراءة شهرية واحدة ما يعني 17 نقطة بيانات 
فقط لكل عميل على مدار العام. كان للبيانات قدرات هائلة» إذا كان من SAL‏ 
الحصول عليها وتحليلها بسهولة. يقول المدير JU‏ لإدارة بلدة كاري كارن ميلز: ol»‏ 
القراءات الشهرية لعدادات oU‏ تشبه الحصول على جالون من بيانات oL‏ المهمة. US‏ 
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القراءة كل ساعة للعدادات فتشبه إلى -35 كبير الحصول على حمام سباحة من الحجم 
الأولمبي مملوء بالبيانات. كما يساعدنا برنامج SAS‏ في إدارة حجم تلك البيانات بشكل 
رائع“. في الواقع؛ فإن هذا الحل يكن إدارة المدينة من تحليل عدد نصف مليار نقطة 
بيانات تخ استخدام امياه وجعلها dla‏ وسهلةً الاستخدام لجميع العملاء. 

إن القراءة المباشرة JS‏ ساعة cololás‏ سواء المنزلية أو التجارية أنتجت بعض 
التطبيقات العملية d‏ وهي: 

oS -‏ لإدارة البلدة إخطار العملاء igo‏ تسريبات مُحتمّلة في غضون أيام. 

- يمكن للعملاء å‏ تنبيهات تخطرهم في غضون ساعات بوجود ارتفاع في استخدام المياه. 

- يمكن للعملاء مراقبة معذّلات استهلاكهم للمياه عبر الإنترنت؛ مما يساعدهم على 
المبادرة في الحفاظ على اطيأه. 

من خلال البوابة الإلكترونية؛ شهدت إحدى المؤسسات التجارية في مدينة كاري 
ارتفاعًا Él‏ في استهلاك المياه في عطلات نهاية الأسبوع في الوقت الذي يقضي فيه 
الموظفون تلك العطلات خارج المدينة. كان ذلك al‏ غريبًا Kaka‏ ولكن القراءة غير 
العادية للعدّادات ساعدت الشركة على اكتشاف خلل في غسالة الصحون التجارية؛ مما 
يجعلها تعمل بشكلٍ مستمر خلال عطلة نهاية الأسبوع. وبدون بيانات عدادات مياه 
اللاسلكية والبوابة الإلكترونية المتاحة للعملاءء كان من الممكن أن تحدث هذه المشكلة 
دون أن يلاحظها أحدٌ؛ مما يؤدي إلى استمرار إهدار -JUls sU‏ 

استخدام تلك البوابة الإلكترونية أعطى المدينة رؤيةٌ أكثر دقةٌ عن الاستخدام اليومي 
للمياه JS)‏ شخص,» وهو Silur Sol‏ في التخطيط للتوشّعات المستقبلية في منشآت 
المياه. ولعل الميزة الأكثر ÉA‏ للانتباه هي أن المدينة تمكتّت من التحقّق من pal‏ ما 
كان له So‏ بعيد المدى على تكاليف فروع الشركة المختلفة. ألا وهو أن سكان كاري 
اقتصاديون li>‏ في استخدامهم للمياه. وتقول مديرة الموارد المائية في المدينة ليلى 
جودوين: ”إننا نقوم بحساب ذلك باستخدام أجهزة حديثة ذات كفاءة dle‏ ويمكن 
أن Las‏ استخدام olb‏ في الأماكن ا مغلقة إلى Yo‏ جالونًا لكل شخص في اليوم الواحد. في 
حين يبلغ معدل استخدام سكان كاري 60 Éole‏ وهو لا يزال 453 معدلًا منخفضًا إلى 
d‏ كبير“. iB BU‏ هذا مهما كانت المدينة تنفق الأموال لتشجيع ترشيد استخدام 
المياه مثل: تقديم خصومات على ال مراحيض المنخفضة التدفق أو عمل تخفيضات على 
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براميل الأمطار. والآن هكن اتخاذ نهج أكثر استهدافًاء ومساعدة مستهلكين مُحدّدين 
على فهم وإدارة استخدام المياه سواء في الأماكن المغلقة أو امفتوحة. 

مم يكن برنامج SAS‏ على قدرٍ من الأهمية لتمكين السكان من فهم استخدامهم 
للمياه فحسب؛ ولکنه Uo]‏ لعب go‏ خفيًا لربط قاعدت بيانات متباينتين. يقول ميلز: 
”لدينا قاعدة بيانات للفواتير وقاعدة بيانات أخرى لقراءة العدادات. لقد كنا في حاجة 
إلى تطويرهما Ua‏ وجعلهما قابلتين للتطبيق“. 

Aquastar إدارة المدينة أنه بمجرد إزالة الحاجة للقراءات اليدوية؛ سيوفر نظام‎ åg 
مليون دولار فوق تكلفة المشروع. ولكن هكن أن يوفر مكؤن التحليلات‎ ٠١ أكثر من‎ 
JUI من المدينة والمواطنين الأفراد توفير قدرٍ من‎ JS وفورات أكبر. وبالفعل؛ فقد استطاع‎ 
في تخطيط احتياجات البنية‎ US عن طريق الاكتشاف المبكر تسرب المياه. وبينما مضي‎ 
oL] التحتية المستقبلية؛ فإن حصول مدينة كاري على معلومات دقيقة حول استخدام‎ 
lols سيساعدها على الاستثمار في العدد الصحيح من البنية التحتية في الوقت المناسب.‎ 
إلى ذلك؛ فإن فهم استخدام المياه سيساعد المدينة إذا لحق بها يءٌ ضار مثل الجفاف.‎ 

تقول A‏ جودوين: ”لقد مررنا بالجفاف في عام ۲۰۰۷م وإذا حدث هذا bya‏ 
أخرى» فلدينا خطة لاستخدام بيانات tAquastar‏ لمعرفة كمية اممياه التي نستخدمها 
على أساس يومي والتواصل مع العملاء. يمكننا عرص ما يحدث هناء وإليك عزيزي 
ال مواطن المقدار الذي يمكنك استخدامه حال انخفاض منس وب الماء لدينا. ونأمل 
ألا نضطر أبدًا إلى استخدام ذلك؛ لكن علينا أن نكون على استعداد دائم». 

أسئلة للمناقشة: 

-١‏ ما التحديات التي كانت تواجهها مدينة كاري؟ 

-Y‏ ما الحل الذي 3& اقتراحه؟ 

-٠‏ ماذا كانت النتائج؟ 

-é‏ ما المشكلات الأخرى وحلول تحليل البيانات التي تتوقعها لمدن مثل كاري؟ 
Source: "Municipality puts wireless water meter-reading data to work (SAS*‏ 
Analytics) - The Town of Cary, North Carolina uses SAS Analytics to analyze‏ 
data from wireless water meters, assess demand, detect problems and engage‏ 


customers." Copyright © 2016 SAS Institute Inc., Cary, NC, USA. Reprinted 


with permission. All rights reserved. 
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أسئلة مراجعة على القسم :0-Y‏ 

-١‏ ما العلاقة بين الإحصاءات وتحليلات الأعمال؟ 

-Y‏ ما الفروق الأساسية بين الإحصاء الوصفي والاستنتاجي؟ 

-Y‏ اذكر وعرّف باختصار مقاييس النزعة المركزية للإحصاءات الوصفية. 

-٤‏ اذكر وعرّف باختصار مقاييس cial‏ للإحصاءات الوصفية. 

0- ما هو مخطط الصندوق وطرفيه؟ وما هي أنواع المعلومات الإحصائية التي يمثلها؟ 
1- ما هي خصائص الشكل الأكثر شيوعًا لوصف توزيع البيانات؟ 


1-۲ نمذجة الانحدار للإحصاءات الاستدلالية: 

Le‏ يكون الانحدار - وخاصةً الانحدار الخطي - هو أوسع تقنيات التحليلات شهرةً وأكثرها 
استخدامًا في الإحصاءات. وتعود جذور الانحدار ou jb‏ إلى عشرينيات وثلاثينيات القرن «Qd eso]‏ 
والتي بدأت بالعمل المبكر على الخصائص الموروثة للبازلاء الحلوة من قبل السب فرانسيس جالتون 
ومن بعده كارل بيرسون. ومنذ ذلك الحين؛ أصبح الانحدار هو التقنية الإحصائية لتوصيف 
العلاقات بين المتغير/ المتغيرات التفسيرية (مدخلات) ومتغير/ متغيرات الاستجابة (مُخرجات). 

كما هو الحال في الأساس؛ فإن الانحدار هو تقنية إحصائية بسيطة نسبيًا لنمذجة ثبعية متغير 
(الاستجابة أو المخرجات) إلى متغيّر تفسيري واحد أو أكثر (مدخلات). وبمجرد تحديدها؛ يمكن تمثيل 
هذه العلاقة بين المتغيرات بشكل رسمي على أنها دالة خطية/ مضافة أو على lil‏ معادلة خطية/ مضافة. 
وكما هو الحال مع العديد من تقنيات النمذجة الأخرى؛ يهدف lass‏ إلى التعرّف على العلاقة الدالية 
فيما بين خصائص العام الحقيقي ووصف هذه العلاقة بنموذج رياضيء والذي قد يُستَخدّم بعد ذلك 
لكشف وفهم تعقيدات الواقع واستكشاف وشرح العلاقات أو التنبؤ بالحوادث المستقبلية. 

ويمكن استخدام الانحدار لواحد من غرضين: الأول هو اختبار فرضية أو استقصاء العلاقات 
المحتملة بين المتغيرات المختلفة: والثاني تقدير التنبؤ بقيم متغيرات الاستجابة £l‏ على متغير 
تفسيري واحد أو أكثر. ولا يقوم أحد هذين الاستخدامين مقام الآخر؛ إذ s‏ القوة التفسيرية 
للانحدار هي LAÍ‏ الأساس لقدرتها على التنبؤ. ففي اختبار الفرضية (بناء النظرية)؛ يمكن أن 
يكشف تحليل الانحدار عن وجود/ قوة واتجاهات العلاقات بين عدد من المتغبرات التفسيرية 
)25 لها Sale‏ بالرمز x‏ «أو س») ومتغير الاستجابة (ويرمز له Šole‏ بالرمز sb» y‏ ص»). أما 
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في التنبؤ؛ suada‏ الانحدار العلاقات الرياضية المضافة (في شكل معادلة) بين واحد أو أكثر من 

المتغيرات التفسيرية ومتغير الاستجابة. وبمجرد تحديد هذه المعادلة؛ يكون من الممكن استخدامها 

للتنبؤ بقيم متغير الاستجابة طمجموعة معينة من قيم المتغيرات التفسيرية. 

- الارتباط مقابل الانحدار: ولأن تحليل الانحدار نشا من دراسات الارتباط ولأن كلتا الطريقتين 
تحاولان وصف العلاقة بين متغيرين (أو أكثر)؛ فإن هذين المصطلحين غالبًا ما يتم الخلط بينهما من 
قبل المتخصصين وحتى العلماء. لا يضع الارتباط افتراضاً بديهياً لتبعية أحد اللتغيرات بلتغير آخر من 
عدمه. كما لا يهتم بالعلاقة بين المتغيرات؛ ولكنه بدلا من ذلك يُعطي تقديرًا على درجة الارتباط بين 
المتغيرات. deg‏ الجانب الآخر؛ يحاول الانحدارٌ أن يَصف تبعية متغير الاستجابة لواحد (أو أكثر) 
من المتغيرات التفسيرية؛ إذ يفترض ضمنيًا أن هناك تأثيراً سببياً أحادي الاتجاه من المتغير التفسيري 
gl)‏ المتغيرات التفسيرية) إلى متغير الاستجابة» بغض النظر s‏ إذا كان مسار التأثير مباشرًا أو غير 
مباشر. أيضًا وعلى الرغم من أنَّ الارتباط يهتم بالعلاقات ذات المستوى المنخفض بين متغيرين؛ OB‏ 
الانحدار يختضٌ بالعلاقات بين جميع المتغيرات التفسيرية ومتغير الاستجابة. 

- الانحدار البسيط مقابل الانحدار المتعدد: إذا تمّ liy‏ معادلة الانحدار بين متغير استجابة واحد 
ومتغير تفسيري واحد؛ عندئذ يُطلق عليه الانحدار البسيط. فعلى سبيل A JEL‏ معادلة 
الانحدار التي C3‏ بغرض توقع/ شرح العلاقة بين طول شخص (التغير التفسيري) ووزنه 
(متغير الاستجابة) مثالا جيدًا على الانحدار البسيط. US‏ الانحدار المتعدد: هو امتدادٌ للانحدار 
البسيط؛ إذ تكون المتغيّرات التفسيرية أكثر من واحد (أو) أكثر من متغير. فعلى سبيل «JULI‏ 
ds‏ نفس JEL‏ السابق: إذا كنا لن نعتمد فقط على طول الشخص للتنبؤ بوزنه بل سنأخذ أيضاً 
في الاعتبار الخصائص الشخصية الأخرى (مثل: مؤشر مجموعة الجسم الجنسء العرق) فإننا 
في هذه الحالة سنقوم بإجراء تحليل الانحدار المتعدد. وفي كلتا الحالتين؛ تكون العلاقة بين 
متغير الاستجابة والمتغير التفسيري (المتغيرات التفسيرية) علاقة خطية ومضافة بالطبيعة. US]‏ 
إذا كانت العلاقات غير خطية؛ فقد نحتاج إلى استخدام واحد من العديد من طرق الانحدار غير 
الخطية الأخرى؛ للوصول بصورة أفضل للعلاقات بين متغيرات المدخلات والمخرجات. 

كيف نطوّر نموذج الانحدار الخطي؟ 

لفهم العلاقة بين متغيرين؛ فإن أبسط e st‏ يمكن القيام به هو رسم مخطط تبعثر؛ إذ Jig‏ 


المحور y‏ (أو ص) قيم متغير الاستجابة» ويمثل المحور  sl)‏ س) قيم المتغير التفسيري (انظر: 
الشكل (Y-Y‏ سيقوم مخطط التبعثر بإظهار التغيّرات في متغير الاستجابة كدالة للتغيرات في 
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المتغير التفسيري. pubs‏ الشكل 17-7 وجود Be‏ طردية بين الاثنين؛ فكلما زادت قيم المتغير 
التفسيري؛ زادت قيم متغير الاستجابة. 

















× ._المتغير gard‏ 
شكل ۲-۱۳: مخطط تبعثر وخط انحدار خطي 
يهدف تحليل الانحدار البسيط إلى إيجاد تمثيلٍ رياضي لهذه العلاقة. وفي الواقع؛ فهو يحاول 
العثور على Gİ‏ دلالة ملرور خط مستقيم بشكل صحيح بين النقاط المرسومة (والتي تمثل البيانات 
التاريخية/ الملاحظة) بطريقة US‏ من المسافة بين النقاط والخط (القيم المتوقعة على خط 
الانحدار النظري). وعلى الرغم من وجود عدة طرق/ خوارزميات مقترحة لتحديد خط الانحدار؛ 
فإن الطريقة الأكثر شيوعًا في الاستخدام تُسمّى طريقة المربعات الصغرى العادية (OLS)‏ تهدف 
طريقة 01:5 إلى تخفيض مجموع المربعات المتبقية (تربيع المسافات الرأسية بين الملاحظة ونقطة 
الانحدار) وتؤدي إلى تعبير رياضي للقيمة التقديرية لخط الانحدار (والتي تُعرف باسم معلمات 
.(b‏ وبالنسبة للانحدار الخطي البسيط؛ يمكن إظهار العلاقة المذكورة أعلاه بين متغير الاستجابة 
(y)‏ والمتغير التفسيري (X)‏ كمعادلة بسيطة كما يلي: 





B, + Box‏ ع بر 


في هذه المعادلة؛ (B0) éug‏ التقاطع. ويُسمّى (BI)‏ الميل. وبمجرد أن تقوم OLS‏ بتحديد 
قيم هذين المعاملين؛ يكون من الممكن استخدامٌ als‏ البسيطة للتنبؤ بقيم Y‏ من قيم × المعطاة. 
وتكشف العلامة وقيمة (B1)‏ أيضًا اتجاه وقوة العلاقة بين كلا المتغيرين. إذا كان النموذج من 
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نوع انحدار خطي متعدد؛ فسيستلزم الأمر تحديد مزيد من المعاملات؛ بحيث يكون هناك معاملٌ 
dels‏ لكلّ متغير تفسيري إضافي. وكما توضّح الصيغة التالية؛ سوف يتم ضرب المتغير التفسيري 
الإضافي مع معاملات (81) الجديدة ويتم جمعها EE‏ لإنشاء تمثيل جمعي خطي طتغير الاستجابة. 


y= B8, + AF, + Bx, + Bx, t..*Bx, 

كيف نعرف ما إذا كان gòga!‏ جيدًا بما فيه الكفاية؟ 
لعدة أسباب متنوعة لا تمثل النماذج في بعض الأحيان الواقع بصورة جيدة وبغض النظر 
عن عدد المتغيرات التفسيرية امُستَخدّمة في النموذج. Ll‏ هناك Salsa]‏ للحصول على نماذج 
بجودة منخفضة. وبالتالي يجب تقييم نموذج الانحدار الخطي وفقاً لمدى ملاءمته (الدرجة التي 
هثل بها متغير الاستجابة). بشكل ta Lua‏ ينتج عن نموذج الانحدار المناسب قيم $23 تكون 
قريبةٌ من القيم الحقيقية التي C$‏ ملاحظتها في الواقع. وبالنسبة للتقييم الرقمي؛ غالبًا ما يتم 
استخدام ثلاثة مقاييس إحصائية في تقييم ملاءمة نموذج الانحدار. R) R?‏ - تربيع)» واختبار F‏ 
الشامل» وخطأ الجذر التربيعي للوسط الحسابي (RMSE)‏ تستندُ هذه المقاييس الثلاثة جميعًا 
على مجموع أخطاء المربع eS)‏ تبعد البيانات عن الوسط الحسابي» وكم تبعد البيانات عن القيم 
المتوقعة للنموذج). وتعمل توليفات مختلفة من هاتين القيمتين على توفير معلومات مختلفة 

حول كيفية مقارنة نموذج الانحدار مع نموذج الوسط الحسابي. 
من بين تلك المقاييس الثلاثة. يحتوي R^‏ على المعنى الأكثر ISl‏ وفهمًا بسبب كونه مقياسًا 
بديهيًا. تاراوح قيمة R^‏ من صفر إلى واحد aal LEL)‏ التباين الذي يظهر كنسبة مئوية)؛ إذ 
يشير ”الصفر“ إلى أن العلاقة وقوة التنبق الخاصة بالنموذج المقترح ليست جيدةٌ؛ في حين Sb‏ 
«الواحد» عن أن النموذج المقترح مناسبٌ GU‏ وينتج توقعات دقيقة (وهذا لايحدث في الواقع 
مطلقاً). oleg‏ ما تكون قيم R‏ الجيدة قريبةٌ من الواحد guall‏ وهذا القرب هو أساس 
الظاهرة التي تم ممذجتها؛ بحيث إذا كانت قيمة 0.3 = R^‏ لنموذج الانحدار الخطي في العلوم 
الاجتماعية؛ فيمكن اعتبار هذه القيمة جيدة Le‏ فيه الكفاية. Lal‏ إذا كانت قيمة 0.7 = R?‏ في 
العلوم الهندسية؛ فهذه القيمة لا iulio AÉ‏ بدرجة كافية. ويمكن تحقيق التحسّن في نموذج 
الانحدار عن طريق إضافة متغيرات تفسيرية Aiuto‏ أو استبعاد بعض المتغيرات خارج النموذج» 
أو استخدام تقنيات تحويل بيانات مختلفة؛ مما يؤدي إلى زيادات نسبية في قيمة R?‏ ويوضح 
الشكل VE-Y‏ عملية تدفق لتطوير نماذج الانحدار. وكما cua‏ من عملية التدفق؛ OB‏ مهمة 
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تطوير النموذج لابد أن تتبعها daga‏ تقييم النموذج؛ إذ لا يقتصر ES‏ على ملاءمة النموذج 
الذي تم تقييمه فقط؛ ولكن بسبب الافتراضات التقييدية التي d‏ على النماذج الخطية الالتزام 
بهاء كما يجب وضع صلاحية النموذج تحت المجهر. 






































شكل 16-1: عملية تدفق تطوير نماذج الانحدار 


ما أهم الافتراضات في الانحدار الخطي؟ 

على الرغم من أنه لا يزال هناك اختيارٌ بين العديد من تحليلات البيانات (سواء لأغراض 
da su‏ أو لأغراض النمذجة التنبؤية)؛ OB‏ نماذج الانحدار الخطي تعاني من Bas‏ افتراضات 
شديدة التقييد. وتعتمد صلاحية النموذج الخطي المبني على قدرته على الالتزام بهذه الافتراضات. 
ونعرض فيما يلي أكثر تلك الافتراضات 3455 


^30 ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


-١‏ الخطية: ينص هذا الافتراض على أن العلاقة بين متغير الاستجابة والمتغيرات التفسيرية هي 
علاقةٌ خطية. مما يعني أن القيمة المتوقعة لمتغير الاستجابة؛ هي دالة hò‏ مستقيم ÍSI‏ 
متغير تفسيريء مع تثبيت جميع المتغيرات التفسيرية الأخرى. وكذلك لا يعتمد ميل الخط 
على قيم المتغيرات الأخرى. ويعني LA‏ أن تأثيرات المتغيرات التفسيرية ا مختلفة على القيمة 
المتوقعة لمتغير الاستجابة؛ هي تأثيرات مضافة بطبيعتها. 

-Y‏ الاستقلالية (للأخطاء): gang‏ هذا الافتراش على أن أخطاء متغير الاستجابة غير مترابطة 
بعضها مع بعض. استقلال الأخطاء أضعف من الاستقلال الإحصائي الفعلي» وهو حالة أقوى 
وغالبًا لا يكون هناك لتحليل الانحدار الخطي. 

£393 هذا الافتراض على أن أخطاء متغير الاستجابة‎ gaug الطبيعية (للأخطاء):‎ -Y 
blii Gl تمامًا ويجب ألا تمثل‎ ils e إنه من المفتتض أن تكون‎ Gl توزيعًا طبيعيا؛‎ 
غير عشوائية.‎ 

-E‏ التباين الثابت (للأخطاء): وهذا الافتراضء والذي (alles‏ عليه أحيانًا (التفاوت المتماثل)» نص 
على أن متغيرات الاستجابة يكون لها نفس التباين في خطأهاء بغض النظر عن قيم المتغيرات 
التفسيرية. وعمليَا؛ لا يكون هذا الافتراض صالحًا إذا اختلف متغيرٌ الاستجابة على نطاق/ 
مقياس واسع ها فيه الكفاية. 

0- الخطية odabi‏ وين هذا الافتراض على عدم وجود ارتباط بين المتغيرات التفسيرية (أَيْ: 
إنها لا تكرر نفس النتيجة؛ ولكنها pÁ‏ المعلومات المطلوبة للنموذج من منظورٍ مختلف). 
ويمكن تطبيق الخطية المتعددة من خلال تضمين النموذج متغيرين أو أكثر من ال متغيرات 
التفسيرية يكون بينها La‏ تام (فمثلًا: إذا تمّ تضمينُ نفس المتغير التفسيري عن طريق 
الخطأ في نفس النموذج مرتينء أو $a‏ واحدةً مع تحؤل طفيف من نفس المتغير). Žoleg‏ ما 
يتم اكتشاف هذا الخطأ بواسطة تقييم البيانات المعتمد على الارتباط. 
هناك تقنيات إحصائية تمّ تطويرها تعمل على كسر هذه الافتراضات والتقنيات للتخفيف 

من أثرها. إن الجزء الأكثر أهميةً بالنسبة eral‏ النماذج هو أن يكون على دراية بوجود وسائل 

تقييم تلك النماذج» وأن يتم وَضْع تلك الوسائل للتأكد من أن النماذج متوافقة مع الافتراضات 

التي يتم بناؤها وفقاً لها. 
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الانحدار اللوجستي: 

يعرف الانحدارٌ اللوجستي على أنه خوارزمية تصنيف» لها دلالة إحصائيةء مستندة على 
الاحتمالية والتي تستخدم bolas‏ خاضعاً للإشراف. وقد تم تطويره في أربعينيات القرن العشرين 
كمتمم JS)‏ من طريقة تحليل الانحدار الخطي وطريقة التمايز الخطي. وقد تمّ استخدامه على 
نطاق gl‏ في العديد من التخصّصات. ها في ذلك مجالات العلوم الطبية والاجتماعية. aling‏ 
الانحدار اللوجستي مع الانحدار الخطي في كونه يهدف كذلك إلى الاعتماد على الدالة الرياضية 
التي تشرح العلاقة بين متغير الاستجابة والمتغيرات التفسيرية باستخدام عينة من الملاحظات 
السابقة (بيانات التدريب). ولكنهما يختلفان في نقطة أساسية واحدة: وهي أن مُخرجات 
الانحدار اللوجستي (متغير الاستجابة) تكون فئة في حين تكون مخرجات الانحدار الخطي متغيراً 
رقمياً. بمعنى أنه في الوقت الذي eda ad‏ فيه الانحدارٌ الخطي لتقدير متغير رقمي مستمر؛ 
يُستخدم الانحدارٌ اللوجستي لتصنيف متغير فئوي. وعلى eel‏ من أن الشكل الأصلي من 
الانحدار اللوجستي قد تم تطويره إلى متغير مخرجات GL‏ (مثل: e /١‏ نعم/ لاء ناجح/ راسب» 
قبول/ رفض)؛ فإن النسخة المعدَّلة في الوقت الحاضر قادرةٌ على التنبؤ بمتغيرات مخرجات متعددة 
الفئات (أيْ: الانحدار اللوجستي المتعدد الحدود). LAÍ‏ إذا كان هناك متغيرٌ $43 واحد. ومتغير 
توفع واحد؛ LÀ. ado‏ الطريقة هنا الانحدارٌ اللوجستي البسيط (وهي مشابهةٌ لطرق استدعاء 
e‏ الانحدار الخطي مع متغير مستقل واحد فقط كانحدار خطي بسيط). 

في التحليلات التنبؤية؛ ez‏ استخدامٌ نماذج الانحدار اللوجستي لتطوير نماذج احتمالية بين 
واحد أو أكثر من المتغيرات التفسيرية/ التوقعية (والتي قد تكون Luja‏ من S‏ من الطبيعة 
المستمرة والفئوية) ومتغير التصنيف/ الاستجابة (والذي قد يكون ثنائياً, ذا حدين أو متعدد 
الحدود/ متعدد الفئات). وعلى عكس الانحدار الخطي الاعتيادي؛ يتم استخدام الانحدار 
اللوجستي؛ للتنبؤ بنتائج فئوية (غالبًا ما تكون ثنائية) لمتغير الاستجابة - معالجة متغير الاستجابة 
كنتيجة لتجربة Bernoulli‏ ولذلك؛ يقوم الانحدارٌ اللوجستي بأخذ اللوغاريتم الطبيعي 
لاحتمالات متغير الاستجابة لإنشاء معيار مستمر كنسخة محولة لمتغير الاستجابة. وبالتالي يُشار 
إلى تحويل logit‏ على أنه دالة الربط في الانحدار اللوجستي - وعلى الرغم من أن متغير الاستجابة 
في الانحدار اللوجستي؛ هو متغيرٌ فئوي أو ثنائي؛ فإن logit‏ هو المعيازٌ المستمر الذي يتم على 
أساسه الانحدار الخطي. ويوضّح الشكل Io Yo-Y‏ الانحدار اللوجستي؛ إذ يتم ats‏ الاحتمالات 
في المحور x‏ (أو س) (دالة خطية للمتغيرات المستقلة). في حين تظهر النتيجة الاحتمالية في المحور 
y‏ (أو (uo‏ (أيْ: تتراوح قيم متغير الاستجابة بين .)١9 ٠‏ 
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شكل -10: الدالة اللوجستية 


dd‏ الدالة اللوجسستية. (Dy‏ الشكل ۲-٠١‏ هي صميم الانحدار اللوجستي, والذي لا هكن أن 
يأخذ سوى القيم بين الصفر والواحد الصحيح. dads‏ ا معادلة التالية تمثيًا رياضيًا مبسطًا لهذه الدالة: 














يتم Sale‏ 55425 معاملات الانحدار اللوجستي (the bs)‏ باستخدام الطريقة القصوى لتقدير 
الاحتمالية. وعلى عكس الانحدار الخطي مع البواقي الموزّعة توزيعًا طبيعيًا؛ فإنه ليس من الممكن 
join‏ على مصطلح مغلق لقيم الممُعامل التي تعظم دالة الاحتمال؛ ولذا ينبغي استخدامٌ عملية 
تكرارية بدلًا من ذلك. fas‏ هذه العملية بحل مبدثي مؤقت» ثم تقوم راجعة المعلمات قليلًا 
لمعرفة ما إذا كان هكن i eod‏ الحل وإعادة هذه المراجعة التكرارية حتى لا يمكن تحقيق أي 
تحسّن أو الوصول للحد الأدنى Alat‏ وعند هذه النقطة يُقال: إِنَّ العملية قد اكتملت/ تقاربت. 

كانت التحليلاثٌ الرياضية تحظى بشعبية هائلة. وأصبح استخدامٌ تقنيات التحليلات المبنية 
على البيانات اتجاهًا سائدًا ليس فقط للفرّق الاحترافية؛ بل LÉ‏ للرياضات الجامعية والهواة. 
والتحليلات الرياضية تعني استخدام البيانات والتقنيات الإحصائية/ التحليلية لإدارة الفرّق/ 
المنظمات الرياضية على نحو أفضل. Ég‏ الحالة العملية a ٤-۲‏ على كيفية استخدام مصادر 
البيانات العامة الموجودة والمتاحة بسهولة للتنبؤ بنتائج مباراة في كرة القدم الجامعية باستخدام 
US‏ من نماذج التصنيف ونماذج التنبؤ بنوع الانحدار. 
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حالة عملية ٤-۲‏ 
توقع نتائج لعبة وعاء NCAA‏ 

Uia التنبؤ بنتيجة لعبة كرة القدم الجامعية (أو أيّ لعبة رياضية أخرى)‎ dd 
مشيرةً للاهتمام ومليئةٌ بالتحدّيات. ولذلك؛ فقد بذل هواة التحَدَّي من الباحثين‎ 
الأكادهيين أو الصناعيين جهدًا عظيمًا في التنبؤ بنتائج الأحداث الرياضية.‎ zl 
من البيانات التاريخية في منافذ إعلامية مختلفة (غالبًا ما تكون‎ eS كمياتٌ‎ dz 
معلنةٌ) فيما يتعلّق بهيكل ونتائج الأحداث الرياضية في شكلٍ مجموعة متنوعة من‎ 
في تلك النتائج.‎ ea Ld أو رمزيًا والتي يفترض أنها‎ Goue العوامل التي يتم تمثيلها‎ 
وعاء ألعاب نهاية ا موسم في غاية الأهمية بالنسبة للكليات من الناحية‎ Ls 
طلايين الدولارات) بالإضافة إلى السّمعة؛ وذلك‎ La المالية (لتحقيق عائد إضافي‎ 
بغرض ضمٌ الطلاب المتفوقين والرياضيين أصحاب التقديرات الكبيرة على برامجهم‎ 
تقوم‎ (Freeman & Brewer, 2016) الرياضية في أثناء مرحلة الدراسة الثانوية‎ 
الفرق التي يتم اختيارها للتنافس في وعاء لعبة معينة باقتسام الجائزة المالية,‎ 
وذات‎ alas بمقدارٍ يعتمد على ذلك الوعاء لكل منهم (بعض الأوعية تكون أكثر‎ 
دفعات أعلى للفريقين)؛ ولذلك 353 ضمان دعوة إلى وعاء اللعبة؛ هو الهدف‎ 
متخذي القرارات‎ els eos برنامج كرة قدم لقسم 1-4 بالكلية.‎ GY الرئيسي‎ 
لألعاب الوعاء صلاحية اختيار ودعوة الجمهور المستحق (فريق لديه ستة‎ 
انتصارات ضد خصومه في القسم 1-4 في ذلك الموسم) للفرّق الناجحة (حسب‎ 
وتنافسي مع‎ ph التقديرات والتصنيفات العالمية) التي ستلعب المباراة بشكل‎ 
الحفاظ على ما تبقى من المشجعين المنضبطين عبر منافذ الإعلام المتنوعة. وفي‎ 
Cogdells Delen من‎ JS دراسة حديثة حول التنقيب في البيانات؛ استخدم‎ 
ثلاث تقنيات شائعة‎ cale إلى‎ bowl ثماني سنوات من بيانات لعبة‎ Kasaps 
للتنقيب في البيانات (أشجار القرارء والشبكات العصبية» وآلة المتجهات الداعمة)؛‎ 
للتنبؤ بكلّ من نتائج تصنيف إحدى الألعاب (الفوز مقابل الخسارة)؛ فضلًا عن‎ 
النتيجة من نوع الانحدار (فرق النقاط المسقطة بين درجات الخصمين). وفيما‎ 
يلي وصفٌ مختصرٌ لدراستهم تلك.‎ 
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المنهجية: 

في هذا البحث؛ اتبع دلين وزملاؤه sgio‏ واسعة الانتشار في التنقيب في 
البيانات تُسمّى CRISP-DM‏ (عملية قياسية عبر الصناعة لتعدين البيانات)» 
وهي ulas‏ من ست خطوات. وقد ciis‏ هذه المنهجية ا مشهورة. والتي Geo‏ 
تناولها بالتفصيل في الفصل uhl‏ طريقة منهجية ومنظمة لإجراء دراسة التنقيب 
في البيانات الأساسيةء ومن ثم زادت من احتمالية الحصول على نتائج دقيقة 
وموثوقة. ولتقييم قوة التنبؤ لأنواع النماذج ا مختلفة بموضوعية؛ قاموا باستخدام 
منهجية للتحقق من الفاعلية» والتي تُسمَّى س-أجزاء .(K-folds)‏ ويمكن الاطلاع 
على تفاصيل منهجية K-fold‏ في الفصل الرابع. ويوضّح الشكل ÉL; ٠١-۲‏ 
المنهجية المُستَخدّمة من قبل الباحثين. 
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شكل 17-7: الرسم التوضيحي للمنهجية المستخدمة في الدراسة 

اقتناء ومعالجة البيانات: 
تم جمعٌ بيانات العينة oda)‏ الدراسة من مجموعة متنوعة من قواعد 
البيانات الرياضية المتاحة على الويبء Le‏ في ذلك ESPN.coms jhowel.net‏ 
Cuka .rauzulusstreet.coms ncaa.orgs Covers.coms‏ مجموعة البيانات 
hla ٤‏ تمثل مجموعةٌ كاملةً من ثمانية مواسم من مباريات كرة القدم الجامعية 
التي تم لعبها بين عامي ۲۰۰۲ و۹١٠۲م.‏ وقد قمنا أيضًا بتضمين مجموعة بيانات 
خارج العينة (ألعاب «(o VY Y Ve‏ للحصول على أغراض فاعلية إضافية. وقد 
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تمّ استخدامٌ بديهية واحدة من البديهيات الرائجة في التنقيب في البيانات» وقاموا 
بتضمين الكثير من المعلومات ذات iI‏ في النموذج قدر الإمكان. لذلك؛ فبعد 
عملية متعمقة لتحديد وتجميع المتغير, انتهى بهم الأمرٌ إلى مجموعة بيانات 
شملت Y‏ متغيراء كانت أول I‏ متغيرات منها gles‏ بتحديد الهوية (أيْ: اسم 
وتاريخ المباراة وأسماء الفرقء صاحب الأرض والضيفء ومؤتمراتهم الرياضية - 
انظر: المتغيرات من ١‏ إلى ٦‏ في الجدول (0-Y‏ ثم يتبعهم YA‏ متغيرا للمدخلات 
Las)‏ متغيرات لتحديد الإحصاءات الموسمية للفريق بشأن الهجوم والدفاع 
ونتائج المباريات» وخصائص تكوين الفريق» وخصائص المؤتمرات uel JI‏ وكيف 
نجحوا في تحَطّي الصعاب - انظر: المتغيرات من ۷ إلى 6" في الجدول (0-Y‏ وأخيرا؛ 
كان آخرٌ اثنين من المتغيرات للمخرجات (وهما WinLosss ScoreDiff‏ - حيث 
يعني ScoreDiff‏ فرق النقاط بين الفريق صاحب الأرض والفريق الضيف Altas‏ 
guro 24x)‏ في حين يشير WinLoss‏ إلى فوز أو خسارة الفريق صاحب الأرض 
للعبة الوعاء والممثلة بعلامة اسمية). 

في صياغة مجموعة البيانات؛ قام كل صف a ka. tuple)‏ الحالة» العينة, 
المثال... إلخ) بتمثيل لعبة وعاءء واختص كل عمودٍ متغير (أيْ: نوع المتغير معرف/ 
مدخلات أو مخرجات). ولتمثيل الخصائص النسبية المرتبطة باللعبة للفريقين 
المتنافسينء في متغيرات المدخلات؟ قمنا بحساب واستخدام الفروق بين مقاييس 
الفريق صاحب الأرض والفريق الضيف. pig‏ حسابٌ S‏ قيم المتغير هذه من 
منظور الفريق صاحب الأرض. على سبيل :JEL‏ ثل المتغير PPG‏ (متوسط عدد 
النقاط التي سجلها الفريق في كل مباراة) الفرق بين ال PPG‏ للفريق صاحب 
الأرض وال PPG‏ للفريق الضيف. JËS‏ متغيرات المخرجات فوز أو خسارة 
الفريق صاحب الأرض للمباراة. بمعنىء لو يأخذ متغير ScoreDiff‏ رقمًا صحيحًا 
tora‏ فمن المتوقع أن يفوز الفريق صاحب الأرض باللعبة بهذا الهامشء وإلا 
(أيْ: لو يأخذ المتغير KS; ScoreDiff‏ صحيحًا سالبًا) فعندئذ نتوقع أن يخسر 
الفريق صاحب الأرض اللعبة بهذا الهامش. في حالة WinLoss‏ تكون قيمة متغير 
المخرجات عبارة عن تسمية ثنائية "Win"‏ أو "Loss"‏ وهي تشير إلى نتيجة 
المباراة بالنسبة للفريق صاحب الأرض. 
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النتائج والتقييم: 

في هذه الدراسة؛ يتخ lai ul‏ ثلاث تقنيات تنبو رائجة لبناء النماذج 
(ومقارنتها بعضها مع بعض): الشبكات العصبية الاصطناعيةء وأشجار القران 
وآلة ا متجهات الداعمة. ang‏ اختيار تقنيات التنبؤ هذه وفقاً لقدرتها على نمذجة 
US‏ من التصنيفات إضافةً إلى مشكلات التنبق من النوع الانحداري وانتشارها 
في أدبيات التنقيب في البيانات المنشورة nao‏ ويمكن العثور على مزيد من 
التفاصيل حول طرق التنقيب في البيانات الشائعة هذه في الفصل الرابع. 

لمقارنة الدقة التنبؤية لجميع النماذج بعضها ببعض؛ استخدم الباحثون 
منهجية التحقق المتقاطع الطبقي k-fold‏ في النسخة الطبقية من فا 
ex‏ إنشاء الطبقات بطريقة تحتوي على نفس النسبة G‏ من علامات التنبؤ 
ssl)‏ الطبقات) كما في مجموعة البيانات الأصلية. وفي هذه الدراسة؛ يتم وَضْعَ 
قيمة 10 = ssl) k‏ يتم تقسيم المجموعة الكاملة المكوّنة من YEE‏ عينة إلى ٠١‏ 
مجموعات فرعية» بكلّ منها VO‏ عينة تقريبًا» والذي 3 ممارسةً شائعةً في 
تطبيقات التنقيب عن البيانات التنبؤية. وقد سبق توضيح K-fold‏ برسم بياني 
قبل ذلك في هذا الفصل. ولمقارنة نماذج التنبؤ التي 63 تطويرها باستخدام تقنيات 
التنقيب الثلاث المذكورة dl‏ فقد استقرٌ الباحثون على استخدام ثلاثة معايير slal‏ 
شائعة الاستخدام» هي: الدقةء والحساسيةء والخصوصية. كما S‏ شرح المعادلات 
البسيطة odg)‏ المقاييس في Cg‏ سابق في هذا الفصل. 


جدول :0-Y‏ وصف للمتغيرات المستخدمة في الدراسة 



































م |الفئة إسم المتغير الوصف 

YEAR | ID| 1‏ سنة لعبة الوعاء 

BOWLGAME| ID| 2‏ اسم لعبة الوعاء 

HOMETEAM | ID! 3‏ القريق صاحب الأرض (كما هو git‏ من قبل منظمي الوعاء) 
AWAYTEAM | ID| 4‏ الفريق الضيف LS)‏ هو git‏ من قبل منظمي الوعاء) 

HOMECONFERENCE | ID| 5‏ | مؤتمر الفريق صاحب الأرض 
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م | الفئة إسم المتغير الوصف 
AWAYCONFERENCE | ID | 6‏ | مؤتمر الفريق الضيف 

blä DEFPTPGM| 11| 7‏ دفاعية S‏ مباراة 

DEFRYDPGM| I1| 8‏ ساحات الاندفاع الدفاعية لكل مباراة 

DEFYDPGM| I1| 9‏ ساحات دفاعية لكل مباراة 

PPG| I1|10‏ متوسط عدد النقاط التي سجلها فريقٌ معين في JS‏ مباراة 
PYDPGM 111‏ متوسط عدد التمريرات الميدانية الإجمالي لكل مباراة 

RYDPGM | I1 |12‏ متوسط إجمالي sas‏ مرات الفوز في كل فريق لكل مباراة 
YRDPGM| I1|13‏ متوسط عدد الهجمات الميدانية لكل مباراة 

XHMWIN | 12|14‏ نسبة الفوز الرئيسية 

LAST7| 12|15‏ كم عدد المباريات التي فاز بها الفريق من آخر V‏ مباريات 
MARGOVIC| 12|16‏ متوسط هامش الفوز 

Nonconference نسبة 55$ فريق‎ NCTW| 12|17 

PREVAPP| 12/18‏ هل ظهر الفريق في مباراة في العام الماضي 

XRDWIN| 12/19‏ نسبة الفوز على الطريق 

SEASTW | 12 |20‏ نسبة الفوز للسنة 

TOP25| 12|21‏ الفوز نسبة ضد أعلى YO‏ فريق AP‏ للسنة 

13]22 |1505 قوة الجدول الزمني للسنة 

XFR| 13|23‏ نسبة المباريات التي يلعبها لاعبو الصف الأول في السنة 
XSO| I3|24‏ نسبة المباريات التي يلعبها لاعبو الصف الثاني في السنة 
XIR| I3|25‏ نسبة المباريات التي يلعبها اللاعبون الأحدث سنا لهذا العام 
XSR| 13/26‏ النسبة المئوية للألعاب التي لعبها لاعبون من الدرجة الأولى خلال العام 
XSEASOvUn| 14| 7‏ نسبة المرات التي 55 فيها الفريق على *O/U‏ في ا موسم الحالي 
XATSCOV | 14|28‏ مقابل نسبة تغطية انتشار الفريق في المباريات السابقة 

XUNDER| 14| 9‏ النسبة المئوية رات انهيار الفريق في المباريات السابقة 
XOVER| 14/30‏ نسبة المرات التي اجتازها الفريق في مباريات سابقة 
XSEASATS| 14|31‏ نسبة التغطية مقابل الانتشار للموسم الحالي 
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م |الفئة إسم المتغير الوصف 

CONCH | 15|32‏ هل فاز الفريق ببطولة امور الخاصة بهم؟ 

CONFSOS| 15 |33‏ قوة المؤتمر من الجدول الزمني 

XCONFWIN | I5|34‏ نسبة الفوز في المؤتمر 

ScoreDiffo | O1 | 35‏ فرق النقاط (نقاط صاحب الأرض - نقاط الضيف) 

WinLosso | 02 | 6‏ ما إذا كان الفريق صاحب الأرض يفوز أو يخسر اللعبة 





* 0/7 - ما إذا كان الفريق سيخترق أو يقل عن فرق النقاط المتوقعة. 
0 متغيرات الإخراج: :5206218 لنماذج الانحدار WinLosss‏ لنماذج التصنيف الثنائية. 
1 المخالفة/ الدفاع؛ 12: نتيجة اللعبة؛ 13: تكوين الفريق؛ 14: ضد الصعاب؛ 15: إحصائيات المؤتمر. 
ID‏ متغيرات تحديد الهوية؛ OL‏ متغير المخرجات لنماذج الانحدار؛ 02: متغير المخرجات لنماذج التصنيف. 
ويتمٌ تقديمٌ نتائج التنبؤ لتقنيات النمذجة الثلاث في الجدول 1-۲ والجدول 
۷-۲ إذ يعرض الجدول T-Y‏ نتائج الفاعلية المتقاطعة من ٠١‏ أضعاف منهجية 
التصنيف؛ إذ تنم صياغة تقنيات التنقيب في البيانات الثلاثة؛ بحيث يكون لها 
متغير مُخرجات GL‏ التسمية (WinLoss ssl)‏ في حين يُقَدَّم الجدول V-Y‏ 
نتائج الفاعلية المتقاطعة من ٠١‏ أضعاف منهجية التصنيف المستندة إلى الانحدار؛ 
إذ تصاغ تقنيات التنقيب في البيانات الثلاثة؛ بحيث يكون لها متغير مخرجات 
رقمي (ScoreDiff s)‏ في التنبؤ بالتصنيف القائم على الانحدار؛ يتم تحويلٌ 
المخرجات العددية للنماذج إلى تصنيفات عن طريق وَضْع علامة "Win"‏ على أرقام 
i251 WinLoss‏ وعلامة "Loss"‏ على أرقام WinLoss‏ السالبةء ثم جدولة ذلك 
كله في مصفوفات الارتباك. باستخدام مصفوفات الارتباك؛ يتم حساب d»‏ التنبؤ 
الشاملة: والحساسيةء والنوعية US)‏ نوع من أنواع النماذج وعرضها في هذين 
الجدولين. وكما تشير النتائج؛ فإن أساليب التنبؤ من نوع التصنيف تؤدي بصورة 
أفضل من منهجية التنبؤ من نوع التصنيف القائم على الانحدار. ومن بين تقنيات 
التنقيب في البيانات الثلاثة؛ أنتجت أشجارٌ التصنيف والانحدار da‏ تنبؤيةً أفضل 
في کل من منهجيتي gi‏ المشار إليهما. وبشكل sple‏ أنتجت نماذج التصنيف 
ونماذج شجرة الانحدار لمنهجية الفعالية المتقاطعة ٠١‏ أضعاف نسبة دقة تصل إلى 
۸ تليها آلة المتجهات الداعمة بنسبة دقة تصل إلى ١5,0/ا/‏ ثم الشبكات 
العصبية بنسبة دقة تصل إلى 4V0‏ وباس تخدام اختبار t‏ وجد الباحثون f‏ قيم 
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الدقة هذه كانت مختلفةٌ بشكل معنوي عند مستوى ألفا eso‏ أي إِنَّ شجرة 
القرارات a5‏ موْشَرّا أفضل بش كل معنوي لهذا النطاق من الشبكة العصبية وآلة 
نقل الدعم وأيضًا آلة نقل الدعم ax‏ مؤشرًا أفضل بكثير من الشبكات العصبية. 


جدول 5-7: نتائج التنبؤ لمنهجية التصنيف المباشر 




















طريقة التنبؤ مصفوفة الارتباك | الدقة ** | الحساسية | الخصوصية 
(تصنيف*) ]2[ e)‏ 0( 

ANN (MLP)‏ فوز "Am VO,‏ ين 
خسارة 

AS VAYA 1,01 فوز‎ SVM (RBF) 
خسارة‎ 

Me A&YY NEA js DT (C&RT) 
خسارة‎ 























* متغير ا مخرجات: هو متغير فئوني Win) US‏ أو (Loss‏ كانت الفروق معنوية. 























.P < 0.01‏ 
جدول ۷-۲: نتائج التنبؤ لمنهجية التصنيف القائم على الانحدار 
طريقة التنبؤ مصفوفة الارتباك 
الدقة ** | الحساسية | الخصوصية 
(قائم على الانحدار*) 
ANN (MLP)‏ فوز VY,o£‏ ۷,10 ,510 
ES‏ 
SVM (RBF)‏ فوز vew VEO‏ 60> 
sius‏ 
DT (C&RT)‏ فوز VRAS vum WAV‏ 
AS‏ 


























* متغير المخرجات هو متغير رقمي/ عدد صحيح )3,8( النقط)؛ كانت الفروق معنوية. 
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وقد أظهرت gib‏ الدراسة Ol‏ نماذج التصنيف النوعية Las‏ بنتائج اللعبة 
بشكل أفضل من نماذج التصنيف القائمة على الانحدار. deg‏ الرغم من أنَّ هذه 
النتائج خاصة بالنطاق العملي والبيانات امس dade‏ في هذه الدراسة. وبالتالي 
لا ينبغي تعميمها خارج نطاق الدراسة؛ فهي مثيرة؛ وذلك لأن أشجار القرار 
ليست الأفضل في التنبؤ فحسب ولكن Ul‏ هي الأفضل في الفهم والنشرء Áo‏ 
مع التقنيتين الأخرتين لتعلّم IY‏ المستخدمتين في هذه الدراسة. ويمكن العثور 
على مزيد من التفاصيل حول هذه الدراسة في Delen)‏ وآخرون (YAY‏ 
أسئلة للمناقشة: 


-١‏ ما هي التحديات المتوقعة في التنبقٍ بنتائج الأحداث الرياضية de)‏ سبيل 
المثال: ألعاب مباراة الكلية)؟ 

-Y‏ كيف قام الباحثون بصياغة/ تصميم مشكلة التنبؤ sl)‏ ما هي المدخلات 
والمخرجات؟ Blag‏ كان تمثيل ius‏ واحدة - صف بيانات؟) 

-Y‏ ما مدى نجاح نتائج التنبق؟ وما الذي يمكنهم فعله لتحسين الدقة؟ 

Sources: Delen, D., Cogdell, D., & Kasap, N. (2012). A compara- tive analysis of 


data mining methods in predicting NCAA bowl outcomes. International Journal of 


Forecasting, 28, 543-552; Freeman, K. M., & Brewer, R. M. (2016). The politics of 


American college football. Journal of Applied Business and Economics, 18(2), 97-101. 


التنبؤ بالسلاسل الزمنية: 

في بعض الأحيان قد لا يكون للمتغير الذي نحن بصدد دراسته (أيْ: متغير الاستجابة) متغيرات 
تفسيرية واضحة ال معا أو قد يكون هناك الكثيرُ منها في علاقة مُعقدة للغاية. في Jis‏ هذه 
الحالات؛ إذا كانت البيانات متاحةً في الشكل المطلوب» فيمكن تطوير نموذج التنبؤء والذي يُسمّى 
السلسلة الزمنية. تُعّف السلسلة الزمنية على أنها سلسلةٌ من نقاط البيانات للمتغيّر محل 
الاهتمام» ويتم قياسها وتمثيلها في blä‏ متتالية في الوقت متباعدة في فواصل زمنية مُوخّدة. ومن 
أمثلة السلاسل الزمنية أحجام الأمطار الشهرية في منطقة جغرافية ماء وقيمة الإغلاق اليومي 
لمؤشرات سوق الأوراق الماليةء ومجموع المبيعات اليومية لمحل بقالة. وفي كثيرٍ من الأحيان؛ &x‏ 
تصوير السلسلة الزمنية باستخدام منحنى خطي. ويُوضّح الشكل W-Y‏ مثالا لسلسلة زمنية 
لحجم المبيعات للسنوات من ۲۰۰۸ حتى ۲۰۱۲ على أساس ربع سنوي. 
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يُعرف التنبؤ بالسلسلة الزمنية على أنه استخدامٌ النمذجة الرياضية للتنبؤ بالقيم المستقبلية 
للمتغير محل الاهتمام بناءً على القيم التي R‏ رصدها من قبل. تبدو مخططات/ جداول السلاسل 
الزمنية darc‏ جداً للانحدار الخطي البسيط في ذلك كما كان الحال في الانحدار الخطي البسيط 
في السلسلة الزمنية يُوجَّد متغيران: متغير الاستجابةء ومتغير الوقت المعروض في مخطط مبعثر. 
وبخلاف هذا التشابه؛ لا يكاد يكون هناك is‏ قواسم مشتركة أخرى بين الاثنين. وعلى الرغم من 
أنَّ تحليل الانحدار يتم توظيفه في اختبار النظريات؛ ممعرفة ما إذا كانت Ul‏ الحالية لواحد أو 
أكثر من اممتغيرات التفسيرية تفسر (وبالتالي تتنبأ ب) متغير الاستجابة؛ OB‏ نماذج السلاسل الزمنية 
تركز على الاستقراء على سلوكها المتغير مع الوقت لتقدير القيم المستقبلية. ويفترض التنبؤ 
بالسلاسل الزمنية أن جميع المتغيرات التفسيرية يتم تجميعها واستهلاكها في دراسة سلوك اختلاف 
الوقت ممتغير الاستجابة. ولذلك؛ فإن اكتشاف سلوك تغيّر الوقت؛ هو طريقة للتنبؤ بالقيم 
المستقبلية لمتغير الاستجابة. وللقيام بذلك؛ ez;‏ اختصارٌ النمط وتحليله إلى مكوناته الرئيسية: 
الاختلافات العشوائيةء والاتجاهات الزمنية» والدورات الموسمية. bgg‏ مثال السلاسل الزمنية 
المعروض في الشكل YV-Y‏ كل هذه الأنماط المميزة. 
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شكل :١1/-7‏ سلسلة زمنية للبيانات عن أحجام المبيعات ربع السنوية 
وتتراوح التقنيات all‏ تَخدّمة في تطوير تنبؤات التسلسل الزمني من بسيطة liy‏ (مثل التنبؤ 
البسيط الذي يقترح أن يكون الفعلي بالأمس هو المتوقع اليوم) إلى معقد lo‏ مثل ARIMA‏ 
(وهي طريقةٌ تجمع بين أنماط المتوسطات المنحدرة والمتحركة في البيانات). ورها تكون التقنيات 
الأكثر شيوعًا؛ هي طرف إيجاد «dull‏ والتي تتضمّن المتوسط البسيط والمتوسط المتحرك وامتوسط 
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المتحرك المرجح. والتضخيم الأسي. كما أنَّ العديد من هذه التقنيات لها Col auo]‏ متقدمةٌ بحيث 
يمكنها Lái‏ أن تأخذ في حُسبانها كلا من الموسمية والاتجاه للتنبق بشكل أفضل وأكثر دقة. وعادةً ما 
يتم تقييم دقة الطريقة من خلال حساب خطأها ssl)‏ الانحراف المحسوب بين الفعليات والتنبؤات 
الخاصة بالملاحظات السابقة) عن طريق الوسط الحسابي للخطأ المطلق (MAE)‏ أو الوسط الحسابي 
للخطأ التربيعي (MSE)‏ أو الوسط الحسابي للخطأ المطلق في النسبة المئوية (MAPE)‏ وعلى الرغم 
من أن جميعهم يستخدمون نفس مقياس الخطأ الأمامي؛ فإنَّ طرق التقييم الثلاث هذه تؤكد 
الجوانب المختلفة للخطأ؛ إذ تقوم بتركيب بعض الأخطاء الكبيرة أكثر من الأخطاء الأخرى. 


أسئلة مراجعة على القسم TY‏ 

-١‏ ما هو الانحدار؟ وما هو الغرض الإحصائي الذي يخدمه؟ 

-Y‏ ما هي أوجه الشبه والاختلاف بين الانحدار والارتباط؟ 

-Y‏ ما هو SOLS‏ وكيف يحدد OLS‏ خط الانحدار الخطي؟ 

£- اذكر مع الشرح الخطوات الرئيسة لمتابعة تطوير نموذج الانحدار الخطي. 

0- ما هي أكثر الافتراضات شيوعًا للانحدار الخطي؟ 

-T‏ ما هو الانحدار اللوجستي؟ وكيف يختلف عن الانحدار الخطي؟ 

-V‏ ما هي السلاسل الزمنية؟ وما هي تقنيات التنبؤ الرئيسة لبيانات السلاسل الزمنية؟ 


V-Y‏ إعداد تقارير الأعمال: 

يحتاج صانعو القرار إلى معلومات لاتخاذ قرارات دقيقة في الوقت المناسب؟ إذ As‏ ا معلومات 
في الأساس سياق البيانات. dala]‏ إلى الوسائل الإحصائية التي تمّ شرحها في القسم السابق» 
Lá Ses‏ الحصول على ا معلومات (التحليلات الوصفية) باستخدام أنظمة معالجة التحليلات 
عبر الإنترنت [OLTP]‏ (انظر: التصنيف البسيط للتحليل الوصفي في الشكل ۷-۲). Šole‏ ما يتم 
تقديم المعلومات إلى صُناع القرار في شكل تقريرٍ مكتوب Lid)‏ أو ورقيًا» مع وجود إمكانية 
لتقديمه شفويًا أيضًا. وببساطة؛ Gl OB‏ تقرير هو عبارة عن أيّ وسيلة اتصال 63 إعدادها؛ بغرض 
نقل ا معلومات في JS‏ مقبول إلى US‏ مَنْ يحتاج dad]‏ في Gi‏ وقت وفي أي مكان قد يحتاج إليها 
فيه. Beleg‏ ما يكون التقريرٌ عبارة عن مستندٍ يحتوي على معلومات (عادةً ما تكون dass‏ على 
البيانات) منظمةً في شكل سرد و/ أو dla‏ و/ أو مجدول؛ يتم إعدادها بشكلٍ دوري (متناوب) أو 
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على أساس الحاجة (حسب الغرض) بالإشارة إلى فترات زمنية dodas‏ أو أحداث أو حوادث أو 
موضوعات. وبإمكان تقارير الأعمال القيام بالعديد من الوظائف المختلفة (ولكنها UU‏ ما تكون 
ذات ilo‏ بعضها ببعض). وفي ما يلي أمثلةٌ على أكثر هذه التقارير انتشارًا: 
- تقارير ŠLI‏ من قيام جميع الإدارات بوظائفها بشكلٍ صحيح. 
- تقارير لتوفير المعلومات. 
- تقارير لتوفير نتائج التحليل. 
- تقارير ÈJ‏ الآخرين على الأداء. 
- تقارير إنشاء ذاكرة تنظيمية (كجزء من نظام إدارة ا معرفة). 

dad‏ إعداد تقارير الأعمال (والذي يُسمّى OLAP LÀ‏ أو ذكاء الأعمال) جزءًا أساسيًا من أدوات 
القيادة العليا بشأن اتخاذ القرارات الإدارية المثالية المحسّنة والقائمة على الأدلة. وينظر إلى أساس 
هذه التقارير التجارية على أنها مصادرٌ مختلفة للبيانات القادمة من داخل أو خارج المؤسسة 
(أنظمة معالجة العمليات التجارية عبر الإنترنت .(OLTP]‏ ويتضمّن إنشاءٌ هذه التقارير إجراءات 
ETL‏ (الاستخراج؛ والتحويل» والتنزيل) بالتنسيق مع مستودع البيانات» ثم استخدام واحد أو أكثر 
من أدوات إعداد التقارير (انظر الفصل ‏ للحصول على وصف مُفْصّل لهذه المفاهيم). 

وبسبب التوشّع السريع في تقنية ا معلومات بجانب الحاجة إلى تحسين القدرة التنافسية في 
قطاع الأعمال؛ فقد حدثت زيادةٌ في استخدام القدرة الحاسوبية لإنتاج تقارير مُوحّدة تنضم إلى 
وجهات نظر مختلفة للمشروع في مكانٍ واحد. Soles‏ ما تتضمّن عملية إعداد التقارير هذه 
الاستعلام عن مصادر البيانات المهيكلة» والتي G3‏ إنشاء معظمها باستخدام eU‏ بيانات منطقية 
وقواميس بيانات مختلفة؛ وذلك لإنتاج تقرير يسهل قراءته واستيعابه. كما تسمح هذه الأنواع 
من تقارير الأعمال للمديرين وزملاء العمل بالبقاء على دراية ومشاركة والقدرة على النظر في 
الخيارات والبدائل لاتخاذ قرارات صائبة. gogg‏ الشكل 18-7 دورةً patua‏ من الحصول 
على البيانات > توليد المعلومات € guo‏ القرار > إدارة عمليات الأعمال. ولعل المهمة الأكثر 
حساسيةً في هذه العملية الدورية؛ هي إعداد التقارير (أيْ: توليد المعلومات) - وتحويل البيانات 
من مصادر مختلفة إلى معلومات قابلة للتطبيق. 

ól‏ مفاتيح النجاح GI‏ تقرير هي الوضوح والإيجاز والاكتمال والصواب. وتتغير طبيعة التقرير 
ومستوى أهمية هذه العوامل المؤدية إلى النجاح بشكلٍ كبير tUa‏ على odo‏ يتم توجيه هذه 
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التقارير؟». يتم توجيه معظم البحوث في التقارير DÉAN‏ نحو التقارير الداخلية التي i‏ أصحاب 
المصلحة وصانعي القرار داخل المنظم ة با معلومات. وهناك أيضًا تقارير خارجية بين الشركات 
والحكومة (مثل: تقارير لأغراض الضريبة أو للإيداعات المنتظمة إلى لجنة الأوراق المالية والبورصات). 








وظائق الأعمال 
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شكل 8-9 1: دور إعداد تقارير المعلومات في اتخاذ القرارات الإدارية 
وعلى الرغم من وجود تشكيلة عريضة من التقارير التجارية؛ فإنه هكن تصنيف تلك التي يتم 
استخدامها غالبًا لأغراض إدارية إلى ثلاث فئات رئيسة )2016 -(Hill,‏ 


0 


- تقارير إدارية موزونة: في العديد من المؤسسات؛ تتم إدارة slal‏ الأعمال من خلال مقاييس 
مُوجَّهة باتجاه النتائج. بالنسبة للمجموعات الخارجية؛ تكون هذه الاتفاقيات على مستوى 
الخدمة. Ul‏ بالنسبة للإدارة الداخلية؛ AS‏ مؤشرات الأداء الرئيسة (KPIs)‏ وعادةٌ ما يكون 
هناك أهدافٌ Gizo‏ عليها على نطاق المؤسسة؛ ليتم تعقّبها على مدى فترة زمنية ما. وهكن 
استخدامها كجزء من إستراتيجيات الإدارة الأخرى Six Sigma Js‏ أو إدارة الجودة الشاملة. 

- تقارير من نوع لوحة المعلومات: كانت الفكرةٌ الشائعة في التقارير التجارية في السنوات الأخيرة, 
هي تقديم مجموعة من مؤشرات الأداء المختلفة على صفحة واحدة. مثل لوحة القيادة في 
السيارة. وعادةً ما يوفر منتجو لوحة المعلومات مجموعةً من التقارير SIJALI‏ مسبقاً بعناصر 
ساكنة وهيكل Cob‏ مع السماح al‏ بتخصيص احتياجات لوحة المعلومات وطرق العرض 
ووضع أهداف بلقاييس مختلفة. ومن الشائع أن تكون هناك إشارات ضوئية مرورية ملونة 
كإشارات المرور المحدّدة للأداء (الأحمرء الأصفر, الأخضر)؛ وذلك لتوجيه انتباه الإدارة إلى مناطق 
معينة. وسيتمٌ الخوض بتفاصيل أكثر عن لوحات المعلومات في جزءٍ لاحق من هذا الفصل. 
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- تقارير متوازنة من نوع بطاقات الأداء: قام بتطوير هذه الطريقة «Kaplan and Norton‏ 
وهي طريقةٌ تحاول تقديم رؤية متكاملة للنجاح في Gi‏ مؤسسة. وإضافةً إلى الأداء المالي؛ S‏ 
التقارير المتوازتة من نوع بطاقات الأداء تتضمّن أيضًا العملاء وعملية الأعمال ووجهات نظر 
للتعلّم والنمو. وسنعرض مزيد من التفصيل بطاقات الأداء المتوازنة لاحقًا في هذا الفصل. 

e‏ الحالة العملية ؟-0 مثالا لتوضيح قوة وفائدة إنشاء التقارير الآلية (وفي وقتِ من 

الأزمات الطبيعية والفوضوية إلى (b A‏ لمنظمة كبيرة. مثل: FEMA‏ 


حالة عملية ٥-۲‏ 
انتهاء فيضان الورق في FEMA‏ 

حصل الموظفون في وكالة إدارة الطوارئ الفيدرالية (FEMA)‏ - وهي وكالةٌ فدرالية 
أمريكية تنسّق الاستجابة للكوارث عندما يعلن الرئيسُ عن وقوع كارثة وطنية - على 
فيضانين OE‏ واحد. isl‏ غطْت المياه الأرض. بعد ذلك؛ غطّى Sas‏ كبيدٌ من الأوراق 
المطلوبة من جانب إدارة البرنامج الوطني للتأمين ضد الفيضانات (NFIP)‏ مكاتب 
هؤلاء الموظفين؛ إذ تع CS‏ حزم كثيرة من التقارير المخططة باللون الأخضر من 
الطابعة المركزية في تلك المكاتب. كانت التقارير الفردية في بعض الأحيان ذات سُمْك 
يبلغ ۱۸ dog‏ مع مجموعة صلبة من المعلومات حول مطالبات التأمين أو أقساط 
التأمينء أو مدفوعات مدفونة فيها في مكانٍ ما. 

لا يدعي بيل بارتون ومايك مايلز أنهما قادران على فعل isl‏ شيء حيال الطقس؛ 
ولكن قام مديرٌ المشروع Ales‏ الحاسب» على التواليه من مؤسسة علوم الحاسب (CSC)‏ 
باستخدام برنامج WebFOCUS‏ من BU"‏ ا معلومات“ لإعادة تدفق فيضان الورق 
بواسطة .NFIP‏ يسمح البرنامجٌ للحكومة بالعمل مع شركات التأمين الوطنية؛ لجمع 
أقساط التأمين ضد الفيضانات ودفع المطالبات للفيضانات في ا مجتمعات التي تبني 
تدابير معينة للتحكم في الفيضانات. وكنتيجة لعمل لجنة ‘CSC‏ م يَعْد موظفو FEMA‏ 
بحاجة إلى تصفح تقارير ورقية للعثور على البيانات التي يحتاجون إليها. وبدلًا من 
ذلك؛ يتصفحون بيانات التأمين المنشورة على موقع «NFIP's BureauNet‏ ويختارون 
فقط ا معلومات التي يرغبون في رؤيتهاء ويحصلون منها على تقريرٍ معروض على شاشة 
أو يقومون بتنزيل البيانات في صورة جدول. وهذه مجرد بداية للمدخرات التي قدَّمها 
575 و وقد انخفض Sae‏ المرات التي يطلب فيها موظفو NFIP‏ من CSC‏ 
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لتقارير خاصة إلى النصف؛ OW‏ موظفي NFIP‏ صار بإمكانهم إنشاء العديد من التقارير 
الخاصة التي يحتاجون إليها دون استدعاء مبرمج لتطويرها. إضافةً إلى تكلفة إنشاء 





BureauNet‏ في المقام الأول. ويُقدَّر بارتون أن استخدام برمجيات الويب وقاعدة 
البيانات التقليدية لتصدير البيانات من الإطار المركزي ل FEMA‏ وتخزينها في قاعدة 
بيانات جديدة. وربطها بخادم ويب - قد يُكلّف قرابة ال ٠٠١‏ ضعف - أي أكثر من 
دولار - ويحتاج إلى حوالي عامين لإكماله. مقارنةً بالأشهر القليلة التي قضاها 
مايلز للوصول إلى dadl‏ عن طريق WebFOCUS‏ 

عندما هبت عاصفة أليسون الاستوائية» وهي عبارة عن مجموعة سحابية 
ضخمة من الغيوم JI‏ 54« وتحرّكت من خليج المكسيك على ساحل تكساس 
ولويزيانا في يونيو ۲۰۰۱ قتلت V€‏ شخصًا معظمهم من الغرقء كما دمّرت 
٠٠٠٠١ caos‏ منزل وشركة كما شرّدت أكثر من ٠٠٠٠١‏ عائلة. وأعلن الرئيس 
جورج دبليو بوش مقاطعة تكساس YA‏ كمنطقة کوارٹ» وتحرّكت FEMA‏ 
للمساعدة. كان هذا أول اختبار جاد BureauNet. J‏ وتم تسليمه بالفعل. 
وقد أذّى هذا الاستخدام الشامل الأول ل BureauNet‏ إلى وصول موظفي FEMA‏ 
الميدانيين بسهولة إلى ما يحتاجون إليه عند الحاجة إليه. وطلب العديد من أنواع 
التقارير الجديدة. ولحُسْن الحظء كان مايلز WebFOCUS‏ على مستوى المهمة. 
يقول بارتون: d»‏ بعض الحالات سوف تطلب Ég FEMA‏ جديدًا من التقارير Dy‏ 
da‏ وسيحصل عليه مايلز على  BureauNet‏ اليوم التالي؛ وذلك بفضل السرعة التي 
يمكنه بها إنشاء تقارير جديدة في -«WebFOCUS‏ 

وأشار بارتون إلى أن الطلب المفاجئ على النظام لم يكن له تأثيرٌ S‏ على أدائه. 
ويضيف: «لقد تعاملنا مع الطلب على ما teli‏ فلم تكن لدينا مشكلات في ذلك على 
الإطلاق. وقد أحدثنا فرقًا Üla‏ ل FEMA‏ وللوظيفة التي كان عليهم القيامٌ بها. إذ م 
يكن لديهم هذا المستوى من الوصول من 3« وأيضًا لم يكن بإمكانهم إنشاء مثل هذه 
التقارير ا مفصّلة والمحدّدة بمجرد النقر بالماوس على سطح مكتبهم كما هو الحال الآن». 

أسئلة للمناقشة: 








-١‏ ما هي FEMA‏ وماذاتفعل؟ 


SFEMA ما هي التحديات الرئيسية التي تواجهها‎ -Y 
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-Y‏ كيف قامت FEMA‏ بتحسين ممارساتها غير الفعّالة لإعداد التقارير؟ 
Source: Information Builders success story. Useful information flows at‏ 
disaster response agency. informationbuilders.com/applications/fema‏ 


(accessed May 2016); and fema.gov. 

أسئلة مراجعة على القسم :V-Y‏ 
-١‏ ما هو التقرير؟ وفيم تُستخدّم التقارير؟ 
-Y‏ ما هو تقرير الأعمال؟ وما هي الخصائص الرئيسة لتقرير الأعمال الجيد؟ 
*- قم بوصف العملية الدورية للإدارة. مع التعليق على دور تقارير الأعمال. 
-E‏ اذكر مع الشرح الفئات الثلاث الرئيسة لتقارير الأعمال. 
0- ما هي المكوّنات الرئيسة لنظام إعداد تقارير الأعمال؟ 
A-Y‏ تصوير البيانات: 

تمّ تعريف تصوير البيانات (أو بشكل أكثر ملاءمةء التصوير المعلوماتي) على أنه «استخدام 
التمثيلات المرئية لاستكشافء ووضع منطق» ونقل البيانات» )2007 ues (Few,‏ الرغم من أن 
الاسم pisé ubl‏ بشكل شائع هو تمثيل البيانات؛ فإن المقصود من هذا هو تصوير المعلومات. 
ولأن المعلومات هي تجميع وتلخيص ووَضْع البيانات في سياقها (حقائق أولية)؛ فإن ما يتم 
تصويره هو ال معلومات وليس البيانات. ومع ذلك؛ ونظرًا لاستخدام ال مصطلحين تصوير البيانات 
وتصوير المعلومات بشكل متبادل ومرادف؛ فإننا سنتبع ذلك في هذا الفصل. 

يرتبط تصويرٌ البيانات ارتباطًا Ls‏ مجالات الرسومات البيانية للمعلومات» وتصوير 
المعلومات والتصوّر العلمي والرسومات البيانية الإحصائية. وحتى وقتٍ قريب؛ كانت الأشكال 
الرئيسة لتصوير البيانات المتاحة في JS‏ من تطبيقات ذكاء الأعمال تتضمّن الجداول والرسوم 
البيانية؛ falaj‏ إلى الأنواع الأخرى من العناصر المرئية ال مستخدّمة لإنشاء بطاقات الأداء ولوحات 
البيانات. ومن أجل فهم أفضل للاتجاهات الحالية والمستقبلية في مجال رؤية البيانات؛ فنرى هنا 
أنه من الأفضل البدء ببعض السياق التاريخي. 
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لمحة تاريخية عن تصوير البيانات: 

على الرغم من حقيقة أن تاريخ تصوير البيانات يعود إلى القرن الثاني الميلادي؛ GB‏ معظم 
التطوّرات التي حدثت في المئتين وخمسين Ule‏ الماضية؛ حدثت في الغالب خلال الثلاثين سنة 
الأخيرة فقط )2007 ues (Few,‏ الرغم من أن التصوير المرثي مم يُعترف به على نطاق واسع 
كنظام حتى وقت قريب؛ OB‏ الأشكال المرئية الأكثر شيوعًا اليوم تعود إلى بضعة قرون سابقة. 
وقد شجّع الاستكشاف الجغرافيء والرياضياتء والتاريخ الشعبي على إنشاء خرائط Sua‏ ورسوم 
بيانية» وجداول زمنية تعود إلى القرن السابع عشر؛ غير أنَّ الفضل ينس ب إلى ويليام بلايفير على 
نطاق واسع كمخترع الرسم البياني الحديث؛ وذلك بعد أن أنشأ أول شريط رسومات بيانية Ejs‏ 
على نطاق واسع في أطلسه التجاري والسياسي لعام e WT‏ وهو ما a‏ بشكلٍ عام Jal‏ سلسلة 
زمنية تصوّر الرسومات البيانية في كتابه الإحصائء الذي 225 عام ۱۸۰۱م (انظر: الشكل 19-9). 
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شكل 19-7: خط بياني لأول سلسلة زمنية عن طريق à WILLIAM PLAYFAIR‏ ۱۸۰۱م 

ولعل أبرز مبتكر للرسومات البيانية للمعلومات خلال هذه الفترة؛ كان تشارلز جوزيف 
مينارد» الذي صوّر Ulo‏ الخسائر التي تكبّدها جيش نابليون في الحملة الروسية عام PANY‏ 
(انظر: الشكل ddl (Y-Y‏ من الحدود البولندية - الروسية» يوضّح الخط السميك حجم الجيش 
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في JS‏ موقع. ويظهر مسار تراجع نابليون من موسكو في فصل الشتاء القارس من خلال الشريط 
السّغلي المظلم, المرتبط بدرجات الحرارة والفترات الزمنية. يقول خبير التصوير البياني والمؤلف 
والناقد الشهير إدوارد توفت bÍ‏ هذا «قد يكون أفضل رسم بياني إحصائي يتم رسمه على الإطلاق». 
في هذا الرس م البياني؛ تمّ تمثيل ÚT Minard‏ بعدّة أا للبيانات (مثل: حجم الجيشء واتجاه 
الحركة» واب مواقع الجغرافيةء ودرجة الحرارة الخارجيةء وما إلى ذلك) بطريقة فنية وإعلامية. وقد 
شهد القرن العشرون بزوغ سلوك جديد للتصوير البياني يتسمٌ بأنه أكثر fran‏ وتخطيطًاء والذي 
كان هيل إلى التركيز على جوانب» مثل: اللون» ومقاييس القيمةء ووضع العلامات. ds‏ منتصف 
القرن العشرين» أصدر رسام الخرائط والباحث النظري جاك بيرتين كتابه ele»‏ الرسم البياني»» 
والذي يقول عنه البعض: إنه يُعتبّر بمثابة الأماس النظري للتصوير الحديث للمعلومات. وعلى 
الرغم من أن معظم أنماطه قد تقادمت بسبب الأبحاث الحديثة أو عدم قابليتها للتطبيق بشكلٍ 
كامل على الوسائط الرقمية؛ ÓL‏ الكثير منها ما Jlj‏ مناسبًا للغاية. 

ومع بدايات LAYI‏ الجديدة؛ ظهر الإنترنت كوسيط جديد للتصوير eI‏ وجَلَّبَ معه الكثير 
من Jadi‏ والقدرات الجديدة. وم يجعل التوزيع الرقمي كلا من البيانات والتصوير البياني على 
مستوى العام أكثر سهولة للوصول إلى جمهور أوسع G)‏ زيادة محو الأمية المرئية)؛ بل حفّز 
أيضًا تصميم نماذج جديدة pias‏ التفاعلء والرسوم المتحركة» وعرض الرسومات البيانية للتقنية 
الفريدة من نوعها لشاشات الوسائطء وتغذية البيانات بشكل فوري لإنشاء بيئات غامرة للتواصل 
واستهلاك البيانات. 

وقد اهتمّت الشركاثٌ والأفراد بالبيانات بشكلٍ مفاجئء وهذا الاهتمام أثارٌ بدوره الحاجة إلى 
أدوات مرئية تساعدهم على فهمها. وتعمل sud‏ الاستشعار الرخيصة الثمن مع فلسفة «قم 
ببناء نظامك الخاص بنفسك» على تقليل تكاليف جمع البيانات ومعالجتها. وقد SSi‏ ظهور 
عدد لا يُحصّى من التطبيقات الأخرىء وأدوات البرامج» ومكتبات الشفرة منخفضة المستوى إلى 
مساعدة الناس في جمع البيانات وتنظيمها ومعالجتها وتصويره ا وفهمها Glas‏ من أيّ مصدر. 
وقد كان الإنترنت أيضًا بمثابة قناة توزيع رائعة للتصويرات البيانية؛ فقد تمّ تجميع مجموعة 
متنوعة من المُصمّمين والمبرمجين ورسامي الخرائط والمشتغلين بالصيانة» والبيانات ال مفككة لنشر 
js‏ أنواع الأفكار والأدوات الجديدة للعمل مع البيانات في S‏ من الأشكال المرئية وغير المرئية. 
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شكل Ys Y‏ هلاك جيش نابليون في أثناء الحملة الروسية لعام ١١۸١م‏ 
كما قامت Lá Google Jal,‏ بمشاركة فردية في JS‏ من اتفاقيات الواجهة (انقر للتنقلء 
انقر نقرًا مزدوجًا للتكبير) والتقنية (خريطة بحجم YO‏ بكسل مربع مع أسماء ملفات يمكن 
التنبؤ بها) لعرض الجغرافيا التفاعلية عبر الإنترنت» بالشكل الذي يعلم به معظم الناس ما يجب 
عليهم فعله عندما يتم د تقديم خريطة عبر الإنترنت. لقد قدَّم Sas iaus Flash‏ كمنصة gia‏ 
لتصميم وتطوير تطبيقات إنترنت غنية وجميلة تتضمّن تصويرات وخرائط بيانات تفاعلية؛ وفي 
الوقت الحالي؛ بدأت تقنيات جديدة للمتصفحات في الظهورء مثل: SVGs «Canvas‏ (والتي يتم 
تضمينها zaina‏ في بعض الأحيان تحت مظلة (HTMLS‏ لتحَذَّي السيادة التي حظي بها فلاش 
والعمل على زيادة فرص وصول واجهات التصوير المتحرك إلى أجهزة التليفون المحمولة. 
يصعب التنبؤ بمستقبل تصوير البيانات/ المعلومات. يمكننا فقط أن نستنتج مما تم اختراعه 
بالفعل: المزيد من التصوير ثلائي الأبعاد. وتجربة مليئة بالبيانات المتعددة الأبعاد في بيئة الواقع 
«ool SS‏ والتصوير البياني الجسم للمعلومات. وهناك فرصة جيدة ob‏ نرى شيئًا جديدًا لم 
نشهده من قبل في ble‏ تصوير المعلومات الذي تم اختراعه قبل نهاية هذا العقد. وتوضّح الحالة 
العملية 7-7 كيف أن أدوات التحليلات/ التقارير المرئية مثل Tableau‏ هكنها أن تساعد في 
تسهيل اتخاذ القرار بفعالية وكفاءة من خلال إنشاء ومشاركة المعلومات/ المعرفة. 


Me‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


حالة عملية ٠-۲‏ 

ماكفارلان سميث يحسن رؤية الأداء التشغيلي باستخدام Tableau Online‏ 
معلومات أساسية: 

حصل مكفارلان سميث على مكانة في التاريخ الطبي؛ إذ عقدت الشركة تعييئًا ملكيًا 
لتوفير الدواء لجلالة الملكة فيكتوريا وزوّدت Las‏ التوليد الرائد السير جيمس سيمبسون 
بالكلوروفورم لتجاربه في تخفيف EI‏ في أثناء ا مخاض والولادة. 3b‏ اليوم ماكفارلان 
سميث شركة à sob‏ لشركة Catalystss Fine Chemical‏ التابعة لشركة Johnson‏ 
À sis Matthey plc‏ الشركة المصنّعة للأدوية؛ هي الشركة الرائدة في العام في تصنيع 
المخدّر الأفيونيء مثل: الكودايين والمورفين. ويقوم موظفو مكفارلان سميث dS‏ يوم باتخاذ 
قرارات بناءً على بياناتهم. فهم يقومون بجمع وتحليل البيانات التشغيلية للتصنيع» 
مثل بيانات تسمح لهم بتحقيق أهداف التحسين المستمر. وتعتمد كل من المبيعات 
والتسويق والتمويل على البيانات؛ لتحديد فرص الأعمال التجارية الدوائية الجديدة 
وتنمية العائدات الاستثمارية وتلبية احتياجات العملاء. وإضافةً إلى ذلك؛ £o‏ فرع 
الشركة في إدنبره إلى مراقبة بيانات الجودة واتجاههاء وإعداد تقارير عنها؛ لضمان هويتها 
وجودتها ونقاء ÍS‏ مكوناتها الدوائية للعملاء والس لطات التنظيمية» Jio‏ إدارة الغذاء 
والدواء الأمريكية (FDA)‏ وغيرها كجزء من ممارسات التصنيع الجيدة (CGMP)‏ 
التحديات: مصادر متعددة للحقيقة والبطء» وعمليات إعداد التقارير المرهقة: 

م تكن عملية جمع تلك البيانات واتخاذ القرارات» وإعداد التقارير سهلةٌ على الرغم 
من ذلك. فقد كانت البيانات الخاصة بالنشاط التجاري Ue fien‏ في ذلك توصيات 
الشركة بشأن تخطيط موارد المشروع (ERP)‏ داخل قواعد البيانات الإدارية القديمة مثل 
SQL‏ وقواعد بيانات «Access‏ وجداول البيانات المستقلة. وعندما تم الاحتياج لهذه 
البيانات gua)‏ القرارء تمّ تكريس وقت طويل le‏ وتخصيص موارد مفرطة للتنقيب في 
البيانات ودمجها وعرضها في جدول بيانات أو في (gl‏ وسيلة عرض أخرى. 

وكانت جودة البيانات مصدر قلق آخر. ونظرًا لاعتماد فرق العمل على مصادرهم 
الفردية للبيانات؛ فقد كانت هناك إصدارات مُتعدّدة من الحقيقة والتعارضات بين 
البيانات. وكان من الصعب أحيانًا معرفة dl‏ إصدار من البيانات كان صحيحًا pls‏ لم 
يكن كذلك. 
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لم يتوقف الأمرٌ عند هذا الحد؛ فحتى بعد gar‏ البيانات وعرضهاء كان إجراء 
تغييرات «على الطاير» بطيئًا وصعبًا. وف الواقع؛ كلما حاول أحد أعضاء فريق ماكفارلان 
سميث عمل اتجاه للبيانات أو إجراء g‏ تحليل آخر؛ فإن التغييرات التي تطرأ على 
البيانات كانت تحتاج إلى الموافقة عليها. وكانت النتيجة النهائية هي أن البيانات كانت 
متقادمةً بشكل مؤثر جدًا في الوقت الذي كانت تستخدم في gio‏ القرار. 

Jal ds‏ ليام ميلزء رئيس قسم التحسين ا مستمر في ماكفارلان سميثء الضوة على 
سيناريو نموذجي لإعداد التقارير؛ فيقول: «تتمثل إحدى عملياتنا الرئيسية في إعداد 
التقارير في الإجراء التصحيحي والإجراء GBI‏ أو CAPA‏ وهو عبارة عن Jaos‏ 
لعمليات التصنيع في ماكفارلان سميث التي 3& اتخاذها لإزالة أسباب عدم التوافق 
أو حالات أخرى غير مرغوب فيها. كما تمّ تخصيصٌ colis‏ الساعات كل شهر لسحب 
البيانات Ul‏ من أجل CAPA‏ - واستغرق الأمر e Uy Gol‏ كل تقرير. وكان تحليلٌ 
الاتجاهات صعبًّا xil‏ لأن البيانات كانت ثابتة (ساكنة). وفي سيناريوهات أخرى 
لإعداد التقارير, غالبًا ما كان يتحتم علينا انتظارٌ dalos‏ جدول محوري لجدول البيانات؛ 
والذي 3( تقديمه بعد ذلك في صورة رمم «dr‏ كما مُت طباعته. وتثبيته على الحائط؛ 
كي يراجعه الجميع بسهولة». 

كانت عمليات إعداد التقارير البطيئة والمكثفة للعمالة. والنسخ امختلفة للحقيقة 
والبيانات الساكنةء كانت كلها عوامل محفزة للتغيير. يقول ميلز: «شعر الكثيرون 
بالإحباط؛ لأنهم اعتقدوا أنهم ليس لديهم صورة كاملة عن العمل. لقد أجرينا الكثير 
والكثير من المناقشات حول القضايا التي واجهناها - عندما كان bial bule‏ عن 
تقارير ذكاء الأعمال». 
الحل: تصويرات البيانات التفاعلية: 

كان لدى أحد أعضاء فريق ماكفارلان سميث خبرة سابقة في استخدام "Tableau‏ 
وأيضًا استكشاف الحلول gabl‏ بها من قبل ميلز. وسرعان ما أقنعت نسخة تجريبية 
مجانية من Tableau Online‏ ميلز بأنَّ de‏ إضافة التصوير التفاعلي للبيانات يمكنه 
coll‏ على مشكلات البيانات التي كانوا يواجهونها. 

ويضيف: «لقد فزت في الحال تقريبًا. فإن سهولة الاستخذام والآداء الوظيفي 
واتساع تصويرات البيانات كلها مثيرة جدًا للإعجاب. وبالطبع؛ كونها حلاً قائماً على 
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البرمجيات كخدمة (SaaS)‏ فإنه لا يُوجَد (Sl‏ استثمار في البنية التحتية التقنية يمكننا أن 
نعيشه على الفور تقريبًاء وأيضًا لدينا ا مرونة لإضافة ا مستخدمين كلما احتجنا إلى ذلك». 

إن أحد الأمئلة الرئيسية التي يجبٌ الإجابة عنها تتعلق بأمان البيانات عبر الإنترنت. 
«لدى الشركة الأم جونس ون ماي إستراتيجية السحابة؛ ولكن يجب أن نكون متأكدين من 
أن إضافة Jo il‏ آمن تمامًا. إن ميزات Tableau Online‏ مثل تسجيل الدخول الفردي 
والسّماح للمستخدمين المصرّح لهم فقط بالتعامل مع البيانات توفر الأمان والثقة اللازمين». 

GI‏ سؤال الأمان الآخر الذي كان ماكفارلان سميث وجونسون di‏ يريدان الإجابة عنه: 
أين يتم تخزين البيانات ماديًا؟ يضيف ميلز: «نحن راضون عن أداء ‘Tableau Online‏ 
والذي يستوف المعايير الخاصة بنا لأمان البيانات والخصوصية؛ إذ تتم استضافة البيانات 
والمصنّفات في مركز بيانات دبلن الجديد في Tableau‏ لذلك فهي لا تغادر أوروبا lj‏ 

وبعد تجربة دامت ستة أسابيع» عمل خلالها مدير المبيعات في Tableau‏ مع ميلز 
وفريقه لبناء قضية تجارية ل Tableau Online‏ وافق فريق الإدارة على ذلك على الفورء 
وبدأ برنامج تجريبي يضم ٠١‏ مستخدمين. وشملت التجربة مبادرة لتحسين جودة التصنيع: 
بالنظر إلى الانحرافات عن القاعدة, كأن يتجاوز جهاز التسخين المستخدّم في عملية تصنيع 
ا مخدرات الأفيونية درجة الحرارة. من هذا اممنطلق؛ تمّ إنشاء لوحة معلومات «عمليات 
الجودة» لتتبّع وقياس الانحرافات ووضع إجراءات لتحسين الجودة والأداء التشغيلي. 

يقول ميلز: «أشارت لوحة المعلومات هذه على الفور إلى أماكن الانحرافات. لم نكن 
hàs‏ عبر صفوفٍ من البيانات - لقد توصّلنا إلى Obl‏ فورية». 

وخلال هذه التجربة ASII‏ والتجريبية؛ استخدم الفريق أدوات التدريب Tableau‏ 
مثل مقاطع الفيديو التدريبية dolabi‏ وإرشادات المنتجات والتدريب ALA‏ عبر 
الإنترنت. كما شاركوا في حدث «التدريب الأساسي» على مدى يومين في لندن. ووفقاً 
مميلز: «كان التدريب Gogog Éo‏ فقط على ا لمستوى الصحيح. وقد أظهر للجميع 
فقط مدى سهولة .Tableau Online‏ فقد أصبح بإمكاننا تصوير ٠١‏ سنوات من 
البيانات في sue‏ قليل من النقرات». لدى الشركة OY‏ خمسة مستخدمين لسطح مكتب 
Tableau‏ وما يصل إلى ۲۰۰ مستخدم مرخص ل -Tableau Online‏ 

"em‏ خاص يشبه ميلز وفريقه ملامح Tableau Union‏ في الإصدار ٩,۳‏ مما يتيح لهم 
ضمٌ البيانات التي تمّ تقسيمها إلى ملفات صغيرة. ويضيف: «من الصعب أحيانًا تجميع 
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البيانات التي نستخدمها للتحليل؛ إذ تيح لنا :5 الاتحاد العمل مع البيانات المنتشرة عبر 
Bae‏ علامات casa‏ أو ملفات؛ مما يقلل من الوقت الذي نقضيه في إعداد البيانات. 
النتائج: تحليلات السّحابة تقوم بتحويل صنع القرار وإعداد التقارير: 
من خلال توحيذ ylab!‏ على Tableau Online‏ حول ماكفارلان سميث سرعة 

ودقة اتخاذ القرار وإعداد تقارير الأعمال. وهذا يتضمّن: 

- يمكن pil‏ لوحات تفاعلية جديدة خلال ساعة واحدة. في السابق؛ كان يستغرق الأمرٌ 
أيامًا لدمج البيانات وعرضها في جدول بيانات ثابت. 

- يمكن الآن eL]‏ تقرير عملية تصنيع CAPA‏ في دقائق. والذي كان يستغرق إنتاجه في 

السابق المئات من ساعات العمل كل شهر - مع الأفكار المشتركة في السحابة. 

- يمكن تغيير التقارير والاستعلام «على الطاير» بسرعة وسهولةء دون تدخل تقني؛ إذ يتمتع 
ماكفارلان سميث is lb‏ لنشر لوحات المعلومات مع Tableau‏ ومشاركتها مع الزملاء 
أو الشركاء أو العملاء. 

- تمتلك الشركة barly Åsums‏ وموثوقةً من الحقيقة. 

- تجري ماكفارلان سميث حاليًا مناقشات حول بياناتها - وليس حول القضايا المتعلقة 
بتكامل وجودة البيانات. 

oS -‏ جلب المستخدمين الجدد عبر الإنترنت على الفور تقريبًا - وليس هناك بنية أساسية 
تقنية لإدارتها. 

وبعد هذا النجاح المبدثي؛ يقوم ماكفارلان سميث الآن بتوسيع نطاق 

Tableau Online‏ إلى إعداد التقارير اطالية. وتحليلات سلاسل التوريد وتوقعات 
المبيعات. ويختتم ميلز قائلًا: «تستند إستراتيجية أعمالنا الآن على قرارات تعتمد 
على البيانات وليس على الآراء. كما UI E‏ التصويرات التفاعلية من تحديد الاتجاهات 
بشكل فوريء وتحديد التحسينات في العملية واستخلاص ذكاء الأعمال إلى المستوى 
التالي. أستطيع OY‏ تعريف مهنتي بواسطة «Tableau‏ 


أسئلة للمناقشة: 








-١‏ ما هي التحديات المتعلقة بالبيانات وإعداد التقارير التي واجهت ماكفارلان 


$Macfarlan Smith سميث‎ 
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-Y‏ ما هو الحل Blag‏ كانت النتاتج/ الفوائد التي S‏ الحصول عليها؟ 
Source: Tableau Customer Case Study, "Macfarlan Smith improves operational‏ 
performance insight with Tableau Online? http://www.tableau.com/stories/customer/‏ 
macfarlan-smith-improves-operational-performance-insight-tableau-online (accessed‏ 


October 2016). 


أسئلة مراجعة على القسم ۸-۲: 

-١‏ ما هو تصوير البيانات؟ وماذا يتم الاحتياج إليه؟ 

-V‏ ما هي الجذورٌ التاريخية لتصوير البيانات؟ 

dle +‏ بعناية تصوير تشارلز جوزيف مينارد الرسمى مسيرة نابليون. مع تحديد والتعليق على 
جميع أبعاد المعلومات التي تم التقاطها في هذا الرسم البياني القديم. 

-E‏ مَنْ هو إدوارد توفت؟ وبرأيك Ule BU‏ أن نتعرف على ما قام به من عمل؟ 

0- ما هو في رأيك «الشيء الكبير التالي» في تصوير البيانات؟ 


٩-۲‏ الأنواع المختلفة للمخططات والرسوم البيانية: 

غالباً مايكون المستخدمون النهائيون لأنظمة تحليلات الأعمال غير متأكدين من نوع الرسم 
البياني أو الجدول البياني الذي يجب أن يستخدموه لغرض معين؛ إذ تكون بعض الرسوم أو 
الجداول البيانية هي أفضل في الإجابة عن أنواع معينة من الأسئلة؛ فقد يبدو بعضها أفضل 
من غيرها ويبدو البعض الآخر de a)‏ ويكون البعض الآخر معقدًا ومزدحمًا إلى حَدَ ما. وفيما 
ياي وصفٌ موجرٌ لأنواع الرسوم البيانية و/ أو الجداول البيانية الشائعة في معظم أدوات تحليل 
الأعمال وأنواع الأسئلة التي هي أفضل في الإجابة/ التحليل. وقد تمّ تجميعٌ هذه المواد من العديد 
من المقالات المنشورة وغيرها من المنشورات (أبيلا ۲۰۰۸؛ هاردن ۲۰۱۲؛ ساس t -V&‏ وآخرون). 


المخططات والرسوم البيانية الأساسية: 
فيما يلي المخططات والرسومات البيانية الأساسية التي تُستخدّم Bale‏ لتصوير المعلومات. 


خط الرسم البياني :(Line Chart)‏ هو الصور البيانية الأكثر استخدامًا لبيانات السلاسل 
الزمنية. وتوضّح المخططات الخطية (أو الرسوم البيانية الخطية) العلاقة بين متغيرين؛ وغالبًا ما يتم 
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استخدامها لتتبّع التغييرات أو الاتجاهات عبر الوقت (تعيين أحد المتغيرات إلى الوقت على المحور 
السيني). وتعمل المخططات الخطية على توصيل نقاط بيانات فردية بشكل متعاقب للمساعدة 
في استكشاف الاتجاهات المتغيرة على مدار فترة زمنية. les‏ ما يتخ استخدام المخططات الخطية؛ 
لإظهار التغييرات المعتمدة على الوقت في e‏ بعض المقاييس» مثل: التغييرات على سعر سهم معين 
على مدار 0 سنوات أو تغييرات على عدد OUL‏ اليومية لخدمة العملاء على مدار الشهر. 
شريط الرسم البياني :(Bar Chart)‏ 355 من أكثر poball‏ الأساسية الأكثر استخدامًا لتمثيل 
البيانات. تكون الرسوم البيانية الشريطية dll‏ عندما يكون لديك بيانات اسمية أو بيانات رقمية 
تنقسم بشكل جيد إلى فئات مختلفة؛ بحيث يمكنك مشاهدة النتائج والاتجاهات النسبية في بياناتك 
بسرعة. وغالبًا ما يتم استخدام المخططات الشريطية لمقارنة البيانات عبر فئات متعددة مثل النسبة 
المئوية للإنفاق الإعلاني بحسب الأقسام أو بحسب فتات المنتجات. هكن أن تكون المخططات الشريطية 
عمودية أو أفقية. ويمكن LÍ‏ تحزهها بعضها فوق بعض؛ لإظهار أبعاد متعددة في مخطط واحد. 
الرسم البياني الدائري :(Pie Chart)‏ وكما يوحي اسمها؛ فهي تكون slo‏ للعين» مخطط 
دائري الهيئة. ولأنها جذابة dig‏ فغالبًا ما نُسيَخِدَم بشكل غير صحيح. فعلى سبيل JEL‏ يمكن 
استخدامها لعرض النسبة المئوية النسبية لميزانية الإعلان التي يتم إنفاقها على خطوط الإنتاج 
المختلفة» أو هكن أن تظهر النّسّب النسبية من التخصصات التي التحق بها طلاب الجامعات في 
سنتهم الدراسية الثانية. فإذا كان عدد الفثات المراد إظهارها Lus‏ إلى 3 ما (على سبيل المثال: أكثر 
من أربعة)؛ فيجب التفكير بجدية في استخدام شريط الرسم البياني بدلا من الرسم البياني الدائري. 
مربع التبعثر :(Scatter Plot)‏ غالبًا ما يتم استخدامها لاستكشاف العلاقة بين متغيرين أو 
ثلاثة (في الصور ثنائية الأبعاد). ولأنها أدوات استكشاف بصريةء ولديها أكثر من ثلاثة متغيرات؛ 
فإن ترجمتها إلى أكثر من ثلاثة أبعاد لا هكن تحقيقها بسهولة. وهي AS dL, us‏ لاستكشاف 
وجود الاتجاهات والتركيزات والقيم المتطرفة. فعلى سبيل المثال: في الرسم البياني ذي المتغيرين 
(المحورين)» يمكن استخدام مربع التبعثر لتوضيح علاقة الارتباط بين عُمْر 0353 مرضى القلبء أو 
يمكن أن يوضّح العلاقة بين عدد ممثلي خدمة العملاء وعدد مطالبات خدمة العملاء المفتوحة. 
ds‏ كثير من الأحيان؛ يتم فر خط اتجاه على مربع التبعثر ثنائي الأبعاد لتوضيح طبيعة العلاقة. 
الرسم البياني الفقاعي «(Bubble Chart)‏ هي غالبًا ما تكون عبارة عن نسخة مُحسّنة من 
مربع التبعتر. وعلى الرغم من ذلك؛ فهي لا iab‏ نمطًا مرئيًا جديدًا؛ بل ينبغي النظر إليها على 
أنها تقنية لإثراء البيانات الموضّحة في مخططات التبعثر (أو حتى الخرائط الجغرافية). ومن 
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خلال تفاوت حجم و/ أو لون الدوائر؛ هكن إضافةٌ أبعاد إضافية للبيانات؛ مما يعطي معنّى أكثر 
Eil‏ حول البيانات. فعلى سبيل ose JÈL‏ استخدامٌ رسم بياني فقاعي؛ لإظهار عرض تنافسي 
لحضور الفصل الدراسي على مستوى الكلية حسب asd‏ وحسب الوقت من اليوم أو هكن 
استخدامه لعرض هامش الربح حسب نوع المنتج وحسب المنطقة الجغرافية. 


المخططات والرسوم البيانية المتخصصة: 

إن الرسوم والمخططات البيانية التي نراجعها في هذا القسم؛ إما مستمدة من المخططات 
الأساسية كحالات dola‏ أو أنها جديدةٌ dL‏ وهي خاصة بنوع المشكلة أو منطقة التطبيق. 

اال مدرج التكراري (Histogram)‏ من الناحية البيانيةء يبدو المدرج التكراري وكأنه شريط 
رسم بياني (bar chart)‏ ويكمّن الفرق بينهما فقط في المعلومات التي يتم تصويرها. ويتم 
استخدامٌ e yall‏ التكراري S‏ لإظهار التوزيع التكراري as‏ أو لعدة متغيرات. في المدرج التكراري» 
غالبًا ما يُستَخدّم المحور السيني لإظهار الفئات أو النطاقات؛ في حين يتم استخدامٌ المحور الصادي 
لإظهار المقاييس/ القيم/ التكرارات. يُظهر المدرج التكراري 5 الشكل التوزيعي للبيانات. وبهذه 
الطريقة؛ من الممكن إجراء فحص بصري لتوزيع البيانات لمعرفة ما إذا كانت ejoa‏ توزيعًا 
rub‏ أو Gal‏ فعلى سبيل JÈL‏ يمكن استخدامٌ ا مدرج التكراري لتوضيح أداء اختبار الفئة؛ إذ 
يمكن عرض توزيع الدرجات إضافةً إلى التحليل المقارن للنتائج الفرديةء أو هكن استخدام المدرج 
التكراري لعرض توزيع أعمار قاعدة العملاء. 

الرسم البياني (Gantt) Cale‏ هي حالة خاصة من شرايط الرسومات البيانية الأفقية التي 
eda us‏ لتصوير الجداول الزمنية للمشروع ومدة مهام/ نشاط المشروع» والتداخل بين المهام/ 
الأنشطة. ومن خلال عرض تواريخ/ أوقات البدء والانتهاء للمهام/ للأنشطة والعلاقات المتداخلة؛ 
eX‏ رسومات جانت مساعدات لا JA‏ بثمن لإدارة المشاريع والتحكّم فيها. فعلى سبيل المثال: 
غالبًا ما zs‏ استخدامٌ مخططات جانت لعرض المخططات الزمنية للمشروع وتداخلات المهامٌ 
وإكمال المهامٌ النسبية (شريط de‏ يُوضْح نسبة الإكمال داخل شريط يعرض المدة الفعلية 
للمهمة) والموارد المخصصة daga JSI‏ والمعالم والإنجازات. 

الرسم البياني بيرت 23s) (Pert)‏ أيضًا الرسوم البيانية للشبكة). esos‏ تطويرها في المقام 
الأول؛ لتبسيط التخطيط وجدولة المشاريع الكبيرة والمعقدة. وهي تُظهر علاقات الأسبقية بين 
أنشطة/ مهام المشروع. يتكوّن الرسم بيرت من ale‏ (ممثلة بدوائر أو مستطيلات) وحواف 
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(ممثلة بالأمهم الموجهة). Flug‏ على ما هو متعارف عليه بالنسبة لبيرت؛ فإنه هكن استخدامٌ 
العقد أو الحوافٌ لتمثيل أنشطة/ مهام المشروع (مخطط النشاط على أساس العقّد مقابل النشاط 
على أساس التمثيل السهمي). 

الخريطة الجغرافية (Geographic map)‏ عندما gaai‏ مجموعة البيانات Gl‏ نوع من 
بيانات الموقع (مثل: العناوين المادية» أو الرموز البريدية» أو أسماء الولايات» أو الاختصارات» أو 
أسماء الدولء أو خطوط العرض/ الطولء أو بعض أنواع الترميز الجغرافي ا مخصص) ويكون من 
الأفضل والأكثر ŠIS‏ الاطلاع على البيانات على خريطة. Gales‏ ما يتم استخدام الخرائط بالتزامن 
مع الرسوم والمخططات البيانية الأخرىء بعضها في مقابل بعض. فعلى سبيل المثال: يمكن استخدامٌ 
الخرائط لعرض توزيع طلبات خدمة العملاء على حسب نوع المنتج (الموضّح في الرسوم البيانية 
الدائرية) على حسب المواقع الجغرافية. وفي كثير من الأحيان؛ يمكن تصويرٌ مجموعة كبيرة من 
المعلومات (مثل: التوزيع العمريء أو توزيع الدخلء أو التعليم» أو النمو الاقتصاديء أو التغيرات 
السكانية) في خريطة جغرافية واحدة؛ للمساعدة في اتخاذ قرار هكان فتح مطعم جديدء أو إنشاء 
محطة خدمة جديدة. وغالبًا ما تُسمََى هذه الأنواع من النظم بنظم المعلومات الجغرافية (GIS)‏ 

مُخططات بولت s (Bullet)‏ غالبًا ما & استخدام مخططات Bullet‏ لإظهار التقدّم نحو 
الهدف. وهي في الأساس شكلٌ من أشكال شريط الرسم البياني. وغالبًا ما يتم استخدامها بدلا من 
المقاييس, والعدادات» ومقاييس الحرارة في لوحة ال معلومات لتوصيل المعنى المراد توصيله بشكل 
أكثر بديهية ضمن مساحة أصغر بكثير. تقارن مخططات Bullet‏ مقياسًا أساسيًا (مثل: الإيرادات 
السنوية) مع واحد أو أكثر من المقاييس الأخرى (مثل: هدف الإيرادات السنوي)» وتقدم ذلك في 
سياق مقاييس slol‏ معينة (مثل: حصص المبيعات). ويمكن لمخططات Bullet‏ أن توضّح بشكلٍ 
بديهي كيفية أداء الإجراء الأساسي مقابل الأهداف العامة (مثل: مدى قرب مندوب المبيعات من 
تحقيق حصته السنوية). 

الخريطة الحرارية å$ :(Heat Map)‏ الخرائط الحرارية عناصر مرئية رائعة؛ لتوضيح المقارنة 
بين القيم المستمرة عبر فئتين باستخدام اللون. ويكون الهدف منها هو مساعدة المستخدم على 
المشاهدة السريعة للمكان الذي يكون فيه تقاطع الفنات أقوى وأضعف من حيث القيم العددية 
للمقياس الجاري تحليله. فعلى سبيل المثال: من الممكن استخدامٌ خرائط الحرارة؛ لإظهار تحليل 
تقسيم الأمواق at adl‏ بحيث يكون المقياس هو مبلغ الشراء (والذي يتم تمثيله بالتدرج 
(sU‏ وتكون الأبعاد هي العمر وتوزيع الدخل. 


4 ذكاء الأعمال والتحليلات وعلم البياناتء منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


جداول التظليل :(Highlight Table)‏ وتهدف جداول التظليل إلى اتخاذ خرائط الحرارة 
خطوة أخرى إلى الأمام. فإضافةً إلى إظهار كيفية تداخل البيانات باستخدام اللون؛ تضيف جداول 
Highlight‏ رقمًا في الأعلى لتقديم تفاصيل إضافية. أي lil‏ جداول ثنائية الأبعاد ذات خلايا 
مملوءة بقيم رقمية وتدرجات لونية. فعلى سبيل المثال: من الممكن عرض slo‏ مندوبي المبيعات 
على حسب نوع المنتج وحجم المبيعات. 

الخرائط الشجرية (Tree Map)‏ وهي تعرض البيانات الهرمية (المهيكلة بشكلٍ شجري) 
كمجموعة من المستطيلات المتداخلة. إذ يتم إعطاء JS‏ فرع من الشجرة Mhara‏ والذي يتم 
بعد ذلك تقاربه مع مستطيلات أصغر تمثل الفروع. ويحتوي مستطيل عقدة الورقة على مساحة 
تتناسب مع بُعد مُحدّد في البيانات. وغالبًا ما يتم تلوين عُقد الأوراق؛ لإظهار as‏ منفصل للبيانات. 
وعندما ترتبط أبعاد اللون والحجم بشكل أو بآخر مع هيكل الشجرة؛ فيمكن بسهولة رؤية JUNI‏ 
التي يصعب اكتشافها بطرق أخرىء كأن يحظى لون معين بأهمية خاصة. أما الميزة الثانية لخرائط 
الأشجار؛ فهي أنها تستخدم الفضاء بكفاءة؛ وذلك عن طريق الشكل الهندسي الذي تتمتع به. 
ونتيجةٌ لذلك؛ فيمكنها عرض آلاف العناصر بشكلٍ مقروء وواضح على الشاشة في Cs‏ واحد. 


iei‏ مخطط أو رسم بياني يجب أن تستخدمه؟ 

ما هو الأفضلء فيما شرحناه سابقاً المخطط el‏ الرسم البياني؟ الإجابة سهلة إلى حَدَّ ما: فلا 
يُوجَّد مخطط أو رسمٌ بياني واحد هو الأفضل على الإطلاق؛ فلو كان 241 كذلك لما كان لدينا هذا 
eSI‏ الكثيرٌ من أنواع الرسومات والمخططات البيانية. فلدى JS‏ واحد منها «مهارات» مختلفة 
بعض الشيء في تمثيل البيانات عن الآخر. لذلك؛ ينبغي أن يكون السؤال الصحيح هو: i»‏ 
مخطط أو رسم بياني هو الأفضل للهمة معينة؟» ويمكن أن تساعد إمكانات المخططات المومّحة 
في القسم السابق في اختيار واستخدام الرسم / المخطط البياني ا مناسب لكل مهمة؛ ولكن يظل 
من الصعب فرزها. كما يمكن استخدامٌ عدة أنواع مختلفة من الرسوم/ المخططات البيانية لنفس 
daga‏ التمثيل التصويري. diis‏ إحدى القواعد الأساسية هي اختيار واستخدام أبسط البدائل 
لتسهيل فهم الجمهور المقصود واستيعابه. 

على الرغم من عدم وجود خوارزمية مقبولة وشاملة على نطاقٍ واسع لاختيار وتصنيف المخطط/ 
الرسم البيانيء pii‏ الشكل YV-Y‏ تنظيمًا شاملا ومنطقيًا إلى io‏ كبير لأنواع ا مخططات/ الرسوم 
البيانية في بنية شبه تصنيفية (نُشرت النسخة الأصلية منه في أبيلا (Y A‏ ويجب أن يتم تنظيم 
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البنية التصنيفية بالشكل الذي يجيب عن السؤال التالي: «ما الذي ترغبٌ في إظهاره في الرسم/ 
المخطط البياني؟» بمعنى؛ ماذا سيكون الغرض من الرسم/ المخطط البياني. وعلى هذا المستوى؛ يقوم 
التصنيف بتقسيم الغرض إلى أربعة أنواع مختلفة - العلاقة والمقارنة والتوزيع والبنية - كما eA‏ 
الفروع إلى cob‏ فرعية ly‏ على عدد المتغيرات المتضمنة والاعتماد على الوقت في التصوير المري. 
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Communication that drives action. Newyork: wiley 
شكل 1-8؟: تصنيف الرسوم والمخططات البيانية‎ 

على الرغم من أن هذه الرسوم والمخططات البيانية تغطي eS ljo‏ مما هو شائع الاستخدام 

في تصوير المعلومات؛ فإنها لا تغطي dS‏ ما يتعلق بهذا الموضوع. وفي الوقت الحاضر يمكننا Sl]‏ 
العديد من الرسوم والمخططات البيانية المتخصّصة الأخرى التي تخدم غرضاً معيناً. علاوةً على 
ذلك؛ يتمثل الاتجاه الحالي في دمج/ تهجين وتحريك هذه الرسوم البيانية؛ للحصول على رؤية 
أفضل وأكثر بديهية jalat‏ البيانات ا معقدة ilis‏ اليوم. فعلى سبيل المثال: توفر الرسوم 
البيانية من نوع Bubble‏ والرسوم التفاعلية» والرسوم المتحركة وام متاحة على موقع Gapminder)‏ 
ilus (gapminder.org‏ مثیرةً للاهتمام لاستكشاف بيانات الصحة والثروة والسكان من منظور 
مُتعدّد الأبعاد. ويوضّح الشكل ۲۲-۲ أنواع الشاشات المتوفرة في الموقع. ويوضّح هذا الرسم البياني 
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كلا من حجم السكانء ومتوسط العمر المتوقع» ونصيب الفرد من الدخل على مستوى القارة؛ كما 
يتم عرض رسوم متحركة متغيرة بمرور الوقت توضّح LAS‏ تغيّر هذه المتغيرات بمرور الوقت. 
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شكل ۲۲-۲: مخطط pwy‏ جغرافي يُظهر ثروات وصحة الأمم 


أسئلة مراجعة على القسم :9-٠‏ 

-١‏ من وجهة نظركء اذا يُوجَد هناك ous]‏ من الأنواع المختلفة من الرسوم والمخططات البيانية؟ 

-Y‏ ما هي الاختلافات الرئيسية بين الرسوم الخطية والشريطية والدائرية؟ ومتى يجب عليك 
استخدام أحدهم دون الآخر؟ 

ToU, -Y‏ تستخدم الخريطة الجغرافية؟ وما هي أنواع الرسوم البيانية الأخرى التي يمكن دمجها 
مع خريطة جغرافية؟ 

-٤‏ أوجد واشرح دور نوعين من الرسوم البيانية التي لم يتم تغطيتها في هذا القسم. 

٠١-٣‏ نشأة التحليلات المرثية: 


كما لاحظ سيث غراهز )2009 (ab‏ هناك «ذوق متزايد» من تقنيات وأدوات تصوير البيانات 
التي GSE‏ مُستخدمي تحليلات الأعمال وأنظمة ذكاء الأعمال من تحسين «علاقات الاتصالء وإضافة 


سياق تاريخي» وگشف الارتباطات الخفيةء وسرد قصص مقنعة توضح العمل وتدعو لاتخاذ إجراء». 
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الفصل الثاني 


كما تؤكد أحدث إصدارات Magic Quadrant‏ على منصات ذكاء الأعمال ومنصات التحليلات 
الصادرة عن Gartner‏ في فبراير ١٠١۲م‏ على أهمية تمثيل البيانات في ذكاء الأعمال والتحليلات. 
وكما يوضّح الرسم البيافي؛ فإن جميع مقترحي الحلول وأصحاب الرؤى في الشركات القيادية هم 
Lal‏ شركات تصوير معلومات حديثة التأسيس نسبيًا (مثل: برمجيات Tableau‏ أو (OlikTech‏ 
أو شركات تحليلات كبيرة وراسخة (مثل مايكروسوفت (Microsoft)‏ و545: و18 و84 و 
(MicroStrategys Alteryx‏ والتي ترگز جهودها "e‏ متزايد على تصوير المعلومات والتحليلات 
المرئية. وتعرض الرؤية الفنية ۲-۲ تفصيلاً لأحدث ما صدر من .Gartner J Magic Quadrant‏ 

في ذكاء الأعمال والتحليلات» تمحورت التحَدَّيات الأساسية لتصوير البيانات حول التمثيل 
البديهي لمجموعات البيانات الكبيرة والمعقدة ذات الأبعاد والمقاييس المتعددة. وبالنسبة للجزء 
Bale SYI‏ ما تتضمّن المخططات والرسوم البيانية النموذجية والعناصر المرئية الأخرى المُستخدّمة 
في هذه التطبيقات 32355« وأحيانًا ثلاثة olal‏ ومجموعات فرعية صغيرة irr‏ من مجموعات 
البيانات. في LAH‏ فإن البيانات الموجودة في هذه الأنظمة موجودة في مستودع البيانات. وكحد 
«dol‏ تتضمّن هذه المستودعات نطاقاً من الأبعاد (مثل: امنتج ا موقع الهيكل التنظيمي» الوقت)» 
ومجموعة من المقاييسء وملايين من خلايا البيانات. وفي محاولة للتصّدّي لهذه التحَدّيات. طوّر 
Sas‏ من الباحثين مجموعةً egita‏ من تقنيات التصوير الجديدة. 

رؤية فنية Y-Y‏ 
جارتنر ماجيك كوادرانت لمنصّات ذكاء الأعمال والتحليلات 

sd‏ جارتنر-إنك ا مؤسس لشركة ماجيك كوادرانت» وهي شركةٌ رائدةٌ في مجال أبحاث 
واستشارات تقنية المعلومات للتداول العَلّني في الولايات المتحدة بعائدات سنوية تجاوزت Y‏ مليار 
دولار في عام Yo‏ !م. وقد c£ adl‏ في عام IAA‏ وكان لديها آنذاك ٠٠١‏ شريك Le‏ في ذلك 
٠٠١‏ محلل واستشاري أبحاث والعديد من العملاء في ٠١‏ دولة. igg‏ ماجيك كوادرانت Galal‏ 
بحث قام بتصميمه وتنفيذه جارتنر لمتابعة وتقييم التقدّم الحاصل ومراكز الشركات في سوق 
مُحدّدة قائمة على التقنية. ومن خلال تطبيق المعالجة الرسومية ومجموعة مُوحّدة من معايير 
التقييم» وتساعد ماجيك كوادرانت المستخدمين على فهم LAS‏ تقبيم مُقدَّمِي التقنية في السوق. 

قامت غارتنر بتغيير اسم ماجيك كوادرانت من «منصات ذكاء الأعمال» إلى «منصات ذكاء 
الأعمال والتحليلات»؛ للتأكيد على الأهمية المتزايدة لقدرات التحليلات لنظم المعلومات التي تبنيها 
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المنظمات الآن. aly saco‏ سوقاً لمنصة ذكاء الأعمال والتحليلات كمنصة برمجية تقوم بتوفير 
Yo‏ إمكانية عبر ثلاث فئات» وهي: التكاملء وتسليم المعلومات, والتحليل. GÀ‏ هذه الإمكانيات 
المؤسسات من بناء أنظمة دقيقة للتصنيف والقياس؛ بغرض دعم صُنع القرار وتحسين الأداء. 

quos‏ الشكل 77-8 أحدث نظام لماجيك كوادرانت الخاص منصات ذكاء الأعمال والتحليلات. 
إذ تضع ماجيك كوادرانت مُقدّمي الخدمات في أربع مجموعات (اللاعبين المتخصّصين» وأصحاب 
التحَدّيء والحالمين» والقادة) على محورين هما: اكتمال الرؤية (المحور السيني) والقدرة على 
التنفيذ (المحور الصادي). وكما يظهر كوادرانت بشكل واضح؛ فإن معظم goii‏ 81/8۸ 
المعروفين جيدًا يتم وضعهم في فتة «القادة» في حين 5 وَضْع العديد من مُقَذّمي الخدمات 
الناشئة الأقل 6,92 والجديدة نسبيًا في فئة «اللاعبين المتخصصين». 

يبدو أنَّ التحول في سوق منصة ذكاء الأعمال والتحليلات مُتعدّد السنوات من التقارير التي 
تقودها تقنية المعلومات إلى تحليلات الخدمات الذاتية التي تقودها الشركات قد اجتاز نقطة التحول. 
إن معظم عمليات الشراء الجديدة هي من منصات التحليلات اللرئية الحديثة» المرتكزة على الأعمال 
التجارية؛ مما يؤدي إلى فرض منظور سوقي جديدء يعمل على إعادة ترتيب وجهة نظر البائعين 
Si‏ ملحوظ. ól‏ معظم النشاط في سوق منصة ذكاء الأعمال والتحليلات هو من المؤسسات 
التي تحاول رفع قدراتها التصويرية والانتقال من النسق الوصفي إلى مستويات التحليلات التنبؤية 
والمفروضة. وقد ركز البائعون في السوق بشكل pS‏ على تلبية طلب المس تخدم. وإذا كان هناك 
سوق واحد في عام 10 AY-‏ فسيصبح اكتشاف/ تصوير البيانات هو فن الهندسة المعمارية السائد. 
وفي الوقت الذي يعمل فيه مُورّدو اكتشاف/ تصوير البيانات» مثل: Qliks Tableau‏ ومايكروسوفت 
(Microsoft)‏ على ترسيخ مراكزهم كقادة لکوادرانت» يحاول آخرون tls)‏ من (od‏ الحلول/ 
الأدوات الناشئين والكبار أو الراسخين) الانتقال من طور أصحاب الرؤى إلى طور القادة. 

يستمر هذا التركيز على اكتشاف/ تصوير البيانات من معظم القادة وأصحاب الرؤى في السوق 
- التي تعمل الآن على تعزيز الأدوات مع تكامل البيانات سهلة الاستخدام من جانب الشركات. إلى 
جانب التخزين qat‏ وطبقات الحوس d,‏ والحفر غير KAM‏ - في تعجيل الاتجاه نحو اللامركزية 
وتمكين المستخدم من ذكاء الأعمال والتحليلات. ahg‏ إلى uS J5‏ قدرة المنظمات على إجراء 
Source: Gartner Magic Quadrant, released on February 4, 2016, gartner.com (accessed‏ 


August 2016). 
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شكل Magic Quadrant :Y-YY'‏ لمنصات ذكاء الأعمال والتحليلات 

التحليلات المرئية: 

تُعرّف التحليلات المرئية بأنها عبارة عن مصطلح تمّ صياغته مؤخرًا وغالبًا ما يُستَخِدّم بشكلٍ لا 
يعني Éd‏ أكثر من jl‏ المعلوماتي. والمقصود بالتحليلات المرئية؛ هو مزيجٌ من تصوير البيانات 
والتحليلات التنبؤية. ففي حين يهدف تصويرٌ المعلومات إلى الإجابة عن الأسئلة التالية: «ماذا 
حدث؟» larg‏ الذي يحدث؟» ويرتبط ارتباطًا وثيقًا بذكاء الأعمال (التقارير الروتينيةء وبطاقات 
الأداءء ولوحات المعلومات). في حين تستهدف التحليلات المرئية الإجابة عن الأسئة: «لماذا يحدث 
هذا؟» و«ما هو الاحتمال الأكبر أن يحدث؟» وعادةٌ ما يرتبط بتحليلات الأعمال (التوقع» التقسيم 
إلى قطاعات» تحليل الارتباط). ويضيف العديدٌ من مُورّدي تصوير المعلومات القدرات التي 
تجعلنا نطلق عليهم اسم $55( حلول التحليلات المرئية. يق ترب معهد SAS‏ - وهو أحد JLS‏ 
مزوّدي حلول التحليلات dio‏ فترة طويلة - من اتجاه آخر؛ فهم يدمج ون قدراتهم التحليلية في 
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بيئة تصوير بيانات عالية الأداء والتي يُطلقون عليها التحليلات المرئية. ولا يختلف Slae|‏ تقارير 
الأعمال fS‏ عن سَرْد القصة من حيث كونه Giya‏ أو غير مرثيء GT‏ أو يدويًاء عبر الإنترنت أو على 
الورق. وتعرض الرؤية الفنية Y-Y‏ وجهة نظر مختلفة وغير تقليدية لتحسين تقارير الأعمال. 
رؤية فنية Y-Y‏ 
سرد قصص عظيمة باستخدام البيانات والتصوير dol!‏ 

يمتلك $a dS‏ لديه بيانات لتحليلها قصضًا das‏ سواء كانت تش ual‏ أسباب الخلل في 
التصنيع» أو تبيع $3 ,$ جديدةً بطريقة تعكس خيال الجمهور at LÀ‏ أو تعطي Moyli‏ 
ÉS‏ عن برنامج تحسين خدمة عملاء معين. وعندما gahan‏ سَرّد قصة ما عن jL‏ إستراتيجي 
كبير يمكّنك cal‏ وفريق الإدارة العليا التابع لك من اتخاذ قرار قوي؛ ÓE‏ تقديم قصة تستند 
إلى الواقع قد يكون s]‏ صعبًا للغاية. وفي جميع الحالات؛ فهي مهمةٌ كبيرة. فعليك أن تكون 
القصة bygis‏ للاهتمام وعالقةً بالذاكرة. فأنت تعلم أنك بحاجة إلى أن تُبقي الأمر بسيطًا على 
مديريك التنفيذيين والزملاء المشغولين. ولكنك تعلم أيضًا أنه ينبغي لك أن تكون واقعيًا وموجّهًا 
بالتفاصيل» وأن تكون مشغولًا بالبيانات» لا سيما في عام اليوم الذي يركز على المقاييس. 

إن لتقديم البيانات والحقائق doa‏ فائقةً. ولكن عندما يتم إغراق الزملاء والإدارة العليا 
بالبيانات والوقائع دون سياق؛ فذلك dad‏ خسارةٌ بلا شك. لقد قمنا جميعً ا بتجربة عروض 
تقدهية باستخدام طبقات الشرائح الكبيرة. فقط لنكتشف أن الجمهور غارق في البيانات لدرجة 
أنهم لا يعرفون ما يفكّرون «o‏ أو أنهم بالكامل لا يأخذون سوى eje‏ بسيط من النقاط الأساسية. 

ابدأ في إشراك فريقك التنفيذيء es‏ إستراتيجياتك ونتائجك بقوة أكبر من خلال الاقتراب من 
diago‏ كراوي. ستحتاج إلى إجابة سؤال: «ما هي قصتك؟» (الحقائق والبيانات)؛ ولكنك ستحتاج 
أيضًا إلى أسئلة من نوع: «من؟» و«كيف؟» و«ماذ!؟» والسؤال الذي يفتقده الجمهور غالبًا هو: 
«ثم efla‏ إنها عناصر القصة التي ستجعل بياناتك ذات صلة وملموسة لجمهورك. إن إنشاء 
قصة جيدة من شأنه مساعدة الإدارة العليا في التركيز على ما هو مهم. 


لماذا قصة؟ 


القصص gis‏ الروح في الحقائق والبيانات وتجعلها er‏ كما هكن أن تساعدك القصة على 
فهم البيانات وترتيبها من خلال مجموعة متباينة من الحقائق. فهي تجعل من السهل Šis‏ النقاط 
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الأماسية ويمكن أن ترسم io oso‏ هكن أن يبدو عليه المستقبل. كما تعمل القصصٌ Ul‏ على 
al‏ نوع من التفاعل؛ بحيث يضع dS‏ واحدٍ من الجمهور نفسه في القصةء ويبدأ التعامل مع الموقف. 

BEYI eat a‏ منذ زمن طويل السرد القصصي؛ لتمرير المعرفة والمحتوى. is‏ سرد 
القصص في بعض الثقافات al‏ حيويًا لهويتهم. فعلى سبيل المثال: في نيوزيلندا؛ يقوم بعض 
شعوب الماوري بوشم وجوههم بالموكوس. والموكوس هو وشم للوجه يحتوي على قصة عن قدماء 
القبائل والعائلات. قد يكون لدى الرجل تصميمٌ وشمي على وجهه يُظهر ملامح رأس مطرقة 
لتسليط الضوء على الصفات الفريدة المتعلقة aci)‏ ويُعبّر التصميمٌ الذي يختاره عن جزء من 
«ذاته الحقيقية» ووطن أسلافه. 

True» يتنقل راوي القصة لإيجاد الشمال الحقيقي‎ da d$ عندما نحاول أن نفهمَ‎ «élus 
وإذا كانت الإدارة العليا تتطلّع إلى مناقشة كيفية استجابتها في المستقبل للتغييرات‎ «North 
التنافسية؛ فإن القصة الجيدة هكن أن تكون ذات معنَّى ومُنقّاة من الكثير من الضوضاء. فعلى‎ 
سبيل المثال: قد يكون لديك حقائق وبيانات من دراستين؛ إحداهما تتضمّن نتائج من دراسة‎ 
إعلانية والأخرى من دراسة حول الرضا عن المنتتج. إن تطوير قصة ما قمت بقياسه في كلتا‎ 
في الوقت الذي تُوجّد فيه أجزاء‎ AUS الدراستين يمكن أن يساعد الأشخاص على الحصول على رؤية‎ 
أن يبدو‎ oS متباينة. ولجَمْع الموزّعين حول منتج جديد. يمكنك استخدامٌ قصة لإعطاء رؤية لما‎ 
مُقدَّم البرامج‎ pusau القصصي تفاعايٌ فعادةً ما‎ sd من ذلك أن‎ alls عليه المستقبل.‎ 
las وصوراً هكن لأفراد الجمهور وضع أنفسهم فيها. ونتيجةٌ لذلك؛ يصبحون أكار‎ col Is 
بالمعلومات وأفضل فهمًا لها.‎ 


TS]‏ ما هي القصة الجيدة؟ 


يكن elis‏ الناس بسهولة Bào‏ وترديدٌُ نص فيلمهم/ كتابهم المفضل. أو يتذكرون Áa‏ 
مضحكةً شاركها أحد الزملاء مؤخرًا. لماذا يتذكر golli‏ هذه القصص؟ لأنها تحتوي على clo‏ 
مميزةٌ معينة. أولا: تحتوي القصة الجيدة على شخصيات عظيمة. وقد يكون لدى القارئ أو 
xe Ld‏ في بعض الحالات خبرةٌ غير مباشرة عندما يصبح مشارگا في الشخصية. والتي xS‏ 
الشخصية) تواجه بعد ذلك تحديًا Gao‏ ولكنه قابلٌ للتصديق. ويجب أن تعترض طريق الشخصية 
بعض عقبات؛ ولكنها تتخطاها. sf els‏ وبنهاية القصة تكون النتيجة واضحةً أو التخمين بها 
ممكن. وقد لا يتم حل الموقف - ولكن لا S‏ للقصة من dbi‏ نهاية واضحة. 
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فكّر في تحليلك كقصة - استخدم هيكل قصة: 
عند صياغة قصة غنية بالبيانات؛ يكون الهدف الأول هو العثور على القصة. مَنْ هم الشخصيات؟ 
ما هي الدراما أو التحَدّي؟ ما هي العقبات الواجب تخطيها؟ وفي نهاية قصتك؛ ما الذي تريد من 
جمهورك أن يفعله كنتيجة لذلك؟ وبمجرد معرفة CÍ‏ القصة, قُمْ بتركيب باقي عناصر قصتك؛ أَيْ: 
حَدَّد شخصياتك. افهم «sol‏ 23575 العقبات» ثم قم ببلورة النتيجة أو سؤال القرار. تأكّد من 
أنك Le uolo‏ تريد أن يفعله الناس كنتيجة لذلك. tag‏ هذا كيفية استرجاع الجمهور لقصتك. 
ثم باستخدام عناصر القصةء قم بكتابة القصة المصوّرة» والتي ÉE‏ هيكل وتكوين قصتك. وعلى 
الرغم من أن hss‏ هذه الخطوة ممتعٌ للغاية؛ فإنه من الأفضل Ms‏ فهم القصة التي ترويهاء 
ومن ثم التركيز على بنية وشكل العرض. وجرد وَضْع لوحة العمل في مكانهاء ستقع بقية العناصر 
الأخرى في مكانها كذلك. وستساعدك لوحة العمل على التفكير في أفضل المجازات أو الاستعارات» 
des‏ تحديد التحَدَّي أو الفرصة بوضوح. وأخيرا ستساعدك على رؤية التدفق والتحؤلات اللازمة. 
وستساعدك لوحة العمل Ul‏ على التركيز على العناصر المرئية الأماسية es all)‏ وا لمخططات 
dols‏ والجرافكس) التي تحتاج إلى استرجاع بواسطة الموظفين الإداريين لديك. ويُوضّح الشكل 
14-1 قصة تأثير القروض الصغيرة من وجهة نظر Jalo dle‏ بيئة التحليلات المرئية في Tableau‏ 
باختصار, لا تخف من استخدام البيانات ad‏ قصص عظيمة. ومن الأهمية بمكان أن تكون 
القصة واقعيةٌ 4485 على التفاصيل وموجهةً بالبيانات في العام المرتكز على القياس في هذه tel‏ 
ولكن ليس بالضرورة أن تكون مملا وطويلًا. وف الواقع» يمكنك من خلال إيجاد القصص الحقيقية 
في بياناتك ومتابعة أفضل الممارسات, گب أشخاص للتركيز على رسالتك - وبالتالي على ما هو 
مهم. وفيما يلي أفضل تلك الممارسات: 
-١‏ فكّر في تحليلك كقصة: استخدم هيكل قصة. 
sus $$ -*‏ فكّر في نفسك كمؤلف أفلام. 
£- اجعل الأمرّ سهلًا على جمهورك وعلى نفسك. 
seo 425-0‏ واجرٍ مناقشةٌ مباشرة. 
Source: Fink, E., & Moore, S. J. (2012). Five best practices for telling great stories with data. White paper‏ 
by Tableau Software, Inc., www.tableau.com/whitepapers/telling-data-stories (accessed May 2016).‏ 
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شكل :۲٤-۲‏ تصوير 3o‏ لقصة في برنامج Tableau‏ 

بيتات تحليلات بصرية عالية القوة: 

نظرًا للطلب المتزايد على التحليلات المرئية المقترنة بأحجام البيانات السريعة النمو؛ فهناك 
تحرك حثيث باتجاه الاستثمار في أنظمة تصوير البيانات ذات الكفاءة العالية. ومع تحرّكاتهم 
الأخيرة في مجال التحليلات المرئية؛ أصبح معهد 545 العملاق للبرمجيات الإحصائية الآن من بين 
أولئك الذين يقودون هذه الموجة؛ إذ A‏ منتجهم الجديد. تحليلات585 dui M‏ حوس & عالية 
الأداءء وحَلاً مختزناً في الذاكرة؛ لاستكشاف كميات هائلة من البيانات في وقت قصير للغاية (فوري 
تقريتًا). فهي GÉ‏ المستخدمين من تحديد الأماطء وتسليط الضوء على الفرص المؤهلة 4931 من 
التحليلء ونقل نتائج مرئية عبر تقارير الويب أو منصة متحركة» مثل: الأجهزة اللوحية والهواتف 
الذكية. ess‏ الشكل Yo-Y‏ البنية العالية المستوى لمنصة تحليلات SAS‏ المرئية. ويُوجَّد على 
أحد طرفي الهندسة ابمعماريةء قدرةٌ ls‏ على إنشاء البيانات وإمكانيات المسؤول؛ مما يؤدي إلى 
مُستكشفء ومُصمّم تقاريرء ووحدات ذكاء الأعمال محمولة قيّمة thor‏ مما يوفر بشكلٍ جماعي 
حلاً تحليلياً مرئياً من البداية إلى النهاية. 
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شكل :YO-Y‏ نظرة عامة على بنية تحليلات SAS‏ المرئية 
وفيما يلي بعص المزايا الرئيسة المقترحة بواسطة تحليلات SAS‏ اطرئية: 


- من جميع المستخدمين من استخدام تقنيات استكشاف البيانات والتحليلات سهلة الإجراء؛ من 
أجل تحسين عملية ao‏ القرار. كما GŠ‏ تحليلات SAS‏ المرئية أنواعًا مختلفةً من المستخدمين 
من إجراء عمليات استكشاف سريعة وشاملة لجميع البيانات اممتاحة. ولا Léa‏ أخذ عينات 


لتقليل حجم البيانات. 


- تعمل واجهات الويب التفاعلية سهلة الاستخدام على توسيع جمهور التحليلات» وتمكينه من 
تحصيل رؤى جديدة. كما مكن للمستخدمين الاطلاع على مزيد من الخيارات» واتخاذ قرارات 


أكثر دقة, والوصول للنجاح بشكلٍ أسرع من ذي قبل. 


Ja as -‏ الإجابة عن الأسئلة المعقدة بشكل أسرع» وتعزيز مساهمات موهبتك التحليلية؛ إذ 
تدعم تقنية تحليلات SAS‏ المرئية عملية اكتشاف البيانات واستكشافها من خلال توفير نتائج 
فائقة السرعة؛ لتمكين إجراء تحليل أفضل وأكثر تركيرًً. ويمكن للمس تخدمين المحنّكين تحليليًا 
تحديدٌُ مجالات الفرص أو التهديدات المتعلقة بالكميات الكبيرة من البيانات؛ بحيث يمكن 


تحقيق مزيدٍ من التحليلات بسرعة. 


(acd -‏ مشاركة المعلومات والتعاون. فيّمكن لأعداد كبيرة من المستخدمينء ما في ذلك ذوو 
المهارات التحليلية المحدودة؛ عَرْضُ التقارير والرسوم البيانية والتفاعل معها بسرعة عبر الويب 
وملفات Adobe PDF‏ وأجهزة iPad‏ المحمولة؛ في حين تحافظ تقنية المعلومات على التحكّم 
في البيانات الأساسية والأمان. وبذلك توفر تحليلات SAS‏ المرئية المعلومات المناسبة للشخص 


ysa 


ا مناسب وفي الوقت المناسب لتحسين الإنتاجية والمعرفة التنظيمية. 
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- تُحرّر تقنية ا معلومات من خلال els‏ المستخدمين طريقة جديدةٌ؛ للوصول إلى ا معلومات التي 
يحتاجون إليها. وأيضًا تحرير تقنية المعلومات من وابل المطالب المستمر من ال مس تخدمين 
الذين يحتاجون إلى الوصول إلى كمياتِ مختلفة من البيانات. ووجهات نظر مختلفة للبياناتء 


مُعدَّة لغرض معين» وطلبات المرة الواحدة للحصول على المعلومات. 


وتقارير 


o SE -‏ تقنية المعلومات من تنزيل البيانات وإعدادها بسهولة لعدَّة مستخدمين. فبمجرد 
تنزيل البيانات lale s‏ متاحةً؛ هكن للمستخدمين استكشاف البيانات بحيوية وإنشاء التقارير 
ومشاركة المعلومات ممفردهم. 

- تُوفْر مساحة للنمؤٌ بوتيرة مُحدّدة ذاتيًا. كما توفر تحليلات SAS‏ المرئية خيار استخدام أجهزة 
قاعدة البيانات للسلع المُقدّمة من EMC Greenplum‏ وتيراداتا. وقد تمّ تصميمه من الألف 


لتحسين الأداء وقابلية التوسّع لتلبية احتياجات أي منظمة b‏ حجم. 


إلى الياء؛ 


ويعرض الشكل 77-7 لقطة شاشة لمنصة تحليلات SAS‏ المرئية؛ إذ يتم تصوير التنبق بالسلاسل 
الزمنية وفاصل من الثقة حول التوقعات. 
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شكل Y-Y‏ لقطة شاشة من تحليلات SAS‏ اللرئية 


ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


أسئلة مراجعة على القسم A-Y‏ 

-١‏ ما الأسبابٌ الرئيسة وراء النشأة الحديثة للتحليلات المرئية؟ 

-Y‏ انظر إلى cota: Magic Quadrant‏ ذكاء الأعمال والتحليلات. ماذا ترى؟ ناقش وعلل ملاحظاتك. 
*- ما القرق بين تصوير المعلومات والتحليلات المرئية؟ 

-E‏ لماذا يجب أن يكون سرد القصص جزءً! من إعدادك للتقارير وتصويرك للبيانات؟ 

0- ما هي بيئة التحليلات المرئية عالية الأداء؟ ولماذا نحتاجها؟ 


١١-‏ لوحات المعلومات: 

xd‏ لوحات المعلومات من المكوّنات الشائعة لمعظم منصات ذكاء الأعمال أو تحليلات الأعماله 
إن م يكن لها جميعًاء وكذلك أنظمة إدارة أداء الأعمالء ومجموعة برامج قياس الأداء. ss‏ لوحات 
المعلومات عروضاً مرئيةٌ لمعلومات مهمة يتم توحيدها وترتيبها على شاشة واحدة؛ بحيث هكن 
استيعابٌ تلك المعلومات في لمحة واحدة وفحصها بسهولة واستكشافها بشكل أكبر. تظهر لوحة 
التحكّم النموذجية في الشكل -YV-Y‏ وتعرض لوحة ا معلومات التنفيذية هذه مجموعةٌ deno‏ من 
مؤشرات الأداء الرئيسة (KPIS)‏ لشركة برمجيات افتراضية تُسمّى Sonatica‏ (لبيع الأدوات الصوتية). 
كما eX‏ تلك اللوحة عرضًا le‏ المستوى للمجموعات الوظيفية المختلفة المحيطة بالمنتجات؛ بددًا 
من نظرة dale‏ إلى جهود التسويق والمبيعات والتمويل وإدارات الدعم. ويهدف JS‏ هذا إلى إعطاء 
صانعي القرار التنفيذيين Ge dias Åm pw $SS‏ يجري داخل المنظمة. على الجانب الأيسر من 
لوحة المعلومات؛ يمكننا أن نرى (بطريقة السلاسل الزمنية) التغييرات ربع السنوية في الإيرادات 
والنفقات وهوامش الربح» وكذلك مقارنة هذه الأرقام بالأرقام الشهرية للسنوات السابقة. في الجانب 
العلوي الأهن؛ نرى وجهين مع مناطق مشفرة بالألوان يعرضان مقدار النفقات الشهرية لخدمات 
الدعم (الاتصال الهاتفي على اليسار) ومقدار النفقات الأخرى (الاتصال الهاتفي على اليمين). كما 
يشير الترميز اللونيء وعلى i‏ من أن نفقات الدعم الشهرية تقع ضمن النطاقات العادية؛ فإن 
النفقات الأخرى تقع في ا منطقة الحمراء؛ مما يشير إلى القيم المفرطة. وتوضّح الخريطة الجغرافية 
في أسفل اليمين توزيع المبيعات على مستوى البلد في جميع أنحاء العالم. تُوجَّد خلف هذه الرموز 
الرسومية do gaza‏ متنوعةٌ من الوظائف الرياضية التي تجمع العديد من نقاط البيانات إلى أعلى 
مستوياتها من الأرقام ذات المعنى. من خلال النقر على هذه الرموز الرسومية» يكن لمستخدمي 
هذه المعلومات الانتقال إلى مستويات أكثر دقة من المعلومات والبيانات. 
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الفصل الثاني 
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:YV-Y JS S‏ عينة لوحة معلومات تنفيذية 
يتم استخدامٌ لوحات المعلومات في مجموعة متنوعة من الأنشطة التجارية ممجموعة متنوعة 
من الأسباب. فعلى سبيل JEL‏ في الحالة العملية ۷-۲ ستجد ملخص التنفيذ الناجح ملعلومات 
لوحات المعلومات من قبل فريق دالاس كاوبويز لكرة القدم. 





حالة عملية V-Y‏ 

فريق دالاس كاوبويز يحقق نتائج كبيرة مع تابلوه (Tableau)‏ وتكنيون (Teknion)‏ 

تأسّس دالاس كاوبويز في عام eV‏ وهو فريق كرة قدم أميري محترف ومقره 
في إيرفينغ, تكساس. ويتبع الفريق uS Sae‏ من الأندية الوطنية» والتي رها تكون 
صاحبة أفضل تمثيل بسجل اتحاد كرة القدم الأميري لعدد المباريات المتتالية في الملاعب 
التي تمّ بيعها بالكامل. 

التحَدّي: 

كان بيل برياكوس - الرئيس التنفيذي للعمليات في القسم التجاري بفريق دالاس 
كاوبويز - وفريقه بحاجة إلى رؤية أكثر وضوحًا في بياناتهم؛ حتى يتمكنوا من تشغيلها 


vv‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


vv 


بشكلٍ AS]‏ ربحية. gd‏ اختيارٌ مايكروس وفت كمنصة أساسية لهذه الترقية بجانب 
عددٍ آخر من تطبيقات المبيعات والخدمات اللوجستية والتجارة الإلكترونية JS)‏ 
ميجاوات). gigs‏ كاوبويز أن بنية المعلومات الجديدة هذه سوف توفر التحليلات 
والتقارير اللازمة. ولكن لسوء الحظ م يحدث هذاء ومن ثم بدأ البحث عن أداة قوية 
paal‏ في المعلومات والتحليلات وإعداد التقارير S‏ هذه الفجوة. 

الحل والنتائج: 

قام js‏ من Teknions Tableau‏ بتوفير إمكانيات إعداد تقارير لوحة ال معلومات 
الفورية» والتي تجاوزت متطلبات كاوبويز. وبشكل phi‏ وممنهج. عمل فريق 
iz Teknion‏ إلى جنب مع مالكي ومستخدمي البيانات داخل دالاس كاوبويز لتقديم 
كل الوظائف المطلوبة: في الوقت المحَدّد وفي حدود الميزانية المرصودة. وقال بيل 
لويزي - نائب الرئيس في «منهاء1: Lög d»‏ مبكر من هذه العملية؛ S‏ قادرين 
على الحصول على فهم واضح مما قد يتطلبه الأمر لتشغيل عملية أكثر ربحيةٌ بالنسبة 
لكاوبويزء Ass‏ هذه الخطوة من العملية ghò‏ رئيسةً في Teknion gẹ‏ مع «daas iS]‏ 
Clos‏ ما يقوم بتوزيع أرباح هائلة كلما أحرزت خطة التنفيذ تقدمًا». وأضاف لويزي: 
«بكلٌ تأكيد؛ لقد عمل Tableau‏ عن CAS‏ معنا ومع كاوبويز خلال المشروع بأكمله. 
وقد حرصنا lo‏ على التأكد من أن كاوبويز يمكنهم تحقيق أهدافهم في alas]‏ التقارير 
والتحليل في زمن قياسي». 

والآن؛ ولأول مرة يستطيع فريق دالاس كاوبويز مراقبة أنشطته التجارية بالكامل 
To‏ من التصنيع ووصولًا إلى العميل «dad‏ وليس فقط رؤية ما يحدث عبر دورة حياة 
النشاط؛ بل التعمّق أكثر في سبب حدوثها. واليوم يتم استخدام حل ذكاء الأعمال؛ 
لإعداد تقرير عن أنشطة الأعمال للقسم التجاري وتحليلهاء والذي Ai‏ المسؤول عن 
جميع مبيعات العلامة التجارية في دالاس كاوبويز. وتشير تقديرات الصناعة إلى أن 
مبيعات كاوبويز تش كل ۲١‏ من جميع مبيعات البضائع في اتحاد كرة القدم الأمريكي؛ 
مما يعكس حقيقة أن كاوبويز هو صاحب أكثر حقوق الامتياز الرياضية شهرةً في العالم. 

وفقًا لإريك لايء مراسل موقع ‘ComputerWorld‏ فقد يكون توني رومو وبقية 
فريق دالاس كاوبويز متواضعي المستوى فقط في مجال كرة القدم في السنوات القليلة 
الماضية» ولكن بعيدًا عن الملعب. olig‏ في ميدان التجارة؛ فإنهم يظلون فريقاً أمريكيًا. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الثاني 


أسئلة للمناقشة: 
-١‏ كيف استخدم دالاس كاوبويز تصوير المعلومات؟ 


-Y‏ ما هو gáa!‏ والحل المقترح والنتائج المتحضّل عليها؟ 
Sources: Lai, E. (2009, October 8). BI visualization tool helps Dallas Cowboys sell‏ 
more Tony Romo jerseys. Computer World; Tableau case study. tableausoftware.com/‏ 


learn/stories/tableau-andteknion-exceed-cowboys-requirements (accessed July 2016). 


تصميم لوحة المعلومات: 

Y‏ 355 لوحات المعلومات مفهومًا جديدًا. فيمكن أن تعود جذورها التاريخية على 
الأقل إلى نظام المعلومات التنفيذية في ثمانينيات القرن العشرين. واليوم تتواجد لوحات 
ا معلومات في js‏ مكان. فعلى سبيل JUL.‏ قبل عدة سنوات. قذَّرت Forrester Research‏ 
أن أكثر من ٤١‏ من أكبر ٠٠٠١‏ شركة في العام استخدمت هذه التقنية (أنتي آند 
مكجريجور (Ys‏ ومنذ ذلك الحين؛ يمكننا أن نعتبر بمنتهى الثقة أن هذا الرقم 
قد ارتفع بشكلٍ كبير. وفي الواقع؛ في هذه الأيام سيكون من غير المعتاد رؤية شركة كبيرة 
تستخدم نظامًا لذكاء الأعمال لا يعتمد على لوحات التحكم في الأداء. كما PALLAD‏ موقع 
yJ Dashboard Spy (dashboardspy.com/about)‏ آخر على وجودها في Js‏ مكان. 
ويحتوي الموقع على أوصاف ولقطات شاشة لآلاف من لوحات المعلومات ذكاء الأعمال» وبطاقات 
النتائج وواجهات ذكاء الأعمال المُستَخدّمة من قبل الشركات من جميع الأحجام والصناعات» 
والمنظمات غير الرّبحية, والوكالات الحكومية. 

وفقاً ل )2006( Eckerson‏ وهو خبيرٌ معروف في ذكاء الأعمال بشكلٍ ele‏ ولوحات المعلومات على 
وجه الخصوص؛ فإن الخاصية الأكثر his‏ في لوحة المعلومات هي last?‏ بثلاث طبقات من المعلومات: 
-١‏ المراقبة: البيانات الرسومية المُستخرّجة AD‏ مقاييس الأداء الرئيسية. 

-Y‏ التحليل: تلخيص البيانات ذات الأبعاد لتحليل السبب الجذري للمشكلات. 
“- الإدارة: تفصيل البيانات التشغيلية التي S355‏ الإجراءات التي يجب اتخاذها لحل مشكلة ما. 





بسبب هذه الطبقات؛ فإن لوحات المعلومات تحوي الكثير من المعلومات في شاشة واحدة. 
ووفقاً ل (2005) Few‏ «يتمثل التحَدَّي الأساسي لتصميم لوحة المعلومات في عرض جميع المعلومات 
المطلوبة على شاشة واحدة بوضوح وبدون تشتيت» بطريقة هكن استيعابها بسرعة». ولسرعة 


Yt‏ ذكاء الأعمال والتحليلات وعلم «LI‏ منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء تصوير البيانات 


استيعاب الأرقام؛ يلزم وَضْع الأرقام في السياق. ويمكن القيام بذلك عن طريق مقارنة الأرقام محل 
الاهتمام بالأرقام الأخرى الأساسية أو المُستَهدّفة؛ وذلك بالإشارة إلى ما إذا كانت الأرقام جيدةً el‏ 
سيئة. عن طريق معرفة ما إذا كان الاتجاه أفضل أم ds ul‏ وباستخدام أدوات أو عناصر عرض 
متخصصة لوضع السياق النسبي والتقديري. وتشتمل بعض المقارنات الشائعة التي يتم إجراؤها 
fole‏ في أنظمة ذكاء الأعمال على مقارنات مع القيم السابقة والمتوقعة والمُستهدّفة والقياسية أو 
القيم المتوسطة والمتعددة لنفس القياس» وقِيّم المقاييس الأخرى (مثل: الإيرادات مقابل التكاليف). 
وحتى مع القياسات النسبية» من امهم أن نشير على وجه التحديد ما إذا كان رقمٌ Sena‏ جيدًا آم 
Éw‏ وما إذا كان Gato‏ في الاتجاه الصحيح أم -Y‏ وبدون هذه الأنواع من الدّلالات التقييميةء قد 
يستغرق الأمرُ E85‏ طويلًا لتحديد حالة رقم ما أو نتيجة معينة. وعادة؛ يتم استخدامٌ GÍ‏ كائنات 
مرئية متخصصة (مثل: إشارات ابمرور والمفاتيح: وا معايير) أو السّمات المرئية (مثل: ترميز الألوان) 
لتعيين السياق التقديري. ويبرز في الحالة العملية Helas Jo A-Y‏ لاستكشاف بيانات التقاري 
يقوم هذا Jod‏ على لوحة المعلومات, وقد $3 بناؤه بواسطة شركة طاقة. 


حالة عملية A-Y‏ 
تساعد التحليلات المرئية مورد الطاقة في عمل روابط أفضل 

تشهدٌ أسواق الطاقة في جميع أنحاء العام تغب وتحؤلًا كبيرين؛ مما يصنع فرضًا 
كبيرةٌ إلى جانب biss‏ كبيرة. وكما هو Jbl‏ في Asbo gi‏ تجتذب الفرصٌ عددًا 
أكبر من اللاعبين في السوق؛ مما يزيد المنافسة:. ويُقلّل من مستوى التفاوت في اتخاذ 
القرارات التجارية بشكلٍ أقل من AJEA‏ ويتطلّب النجاح إنشاء ونشر معلومات 
دقيقة وفي الوقت المناسب وتقدهها إلى (sl‏ شخص. وكلما دعت الحاجة. فعلى سبيل 
اممثال: إذا aS‏ بحاجة إلى S at‏ من ميزانيات التسويق بسهولةء والتوازن بين أحمال 
عمل الموظفين» واستهداف JI‏ العملاء برسائل تسويقية abs‏ فستحتاج إلى ثلاثة حلول 
مختلفة لإعداد التقارير. تقوم شركة jS. Electrabel GDF SUEZ‏ ذلك؛ من أجل 
وحدة أعمال التسويق والمبيعات الخاصة بها مع Aia‏ تحليلات SAS‏ المرئية. 





إن تهج Jod‏ الواحد هو توفي كبر للوقت لمحترفي التسويق في صناعة تشهد تغيراً 
هائلاً. يقول داني نوب -مدير إعداد التقارير والتطوير في وحدة أعمال التسويق والمبيعات 
في :Electrabel‏ «إنه 355 كبير لاستقرار مركزنا السوقي في سوق الطاقة. Jens‏ ذلك 
jila gal‏ وهوامش الرّبح Sd‏ من عملاء التجزئة والأعمال التجارية». ds‏ هذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yeo‏ 


الفصل الثاني 


الشركة 1 مور للكهرباء في بلجيكا وأكبر منت ج للكهرباء في كل من بلجيكا وهولندا. 
يقول نوب: «إنه من الأهمية بمكان أن تزيد Electrabel‏ من كفاءة اتصالات عملائها؛ 
إذ إنها تستكشف القنوات الرقمية الجديدة وتطوّر خدمات جديدة متعلقة بالطاقة». 

ويضيف نوب: «كلما عرفنا العملاء بشكل أفضل؛ كان احتمالٌ نجاحنا aS]‏ وهذا 
هو Caul‏ في أننا نجمع المعلومات من مصادر متنوعةء مثل: حركة الهاتف مع العميل 
والأسئلة عبر الإنترنت» والرسائل النصيةء وحملات البريد. وستّشكل هذه المعرفة المعرّزة 
لعملائنا وقاعدة العملاء المحتملين jis‏ إضافيةٌ في سوقنا التنافسية». 

نسخة واحدة من الحقيقة: 


كانت Electrabel‏ تستخدم منصات وأدوات متنوعةً لأغراض إعداد التقارير. وقد 
uel‏ ذلك God‏ إلى غموض في الأرقام المذكورة. وقد واجهت المؤسسة lé]‏ مشكلاتٍ في 
الأداء في معالجة وحدات مستودعات البيانات الكبيرة. تزيل تحليلات SAS‏ المرئية مع 
تقنية الذاكرة الغموض ومشكلات الأداء. يقول نوب: «لدينا الاستقلالية والمرونة للاستجابة 
للحاجة إلى رؤية العملاء وتصوير البيانات داخليًا. وبعد JS‏ هذا Slasyl Sd‏ السريع 
للتقارير أحد المتطلبات الأساسية للإدارات الموجّهة عمليًا مثل المبيعات والتسويق». 

العمل بشكل أكثر كفاءة. وبتكلفة أقل: 

تسعى تحليلاتٌ SAS‏ ا مرئية إلى تشغيل عملية تحديث المعلومات في التقارير 
بصورة آلية. فبدلًا من إنشاء تقرير قديم في وقت اكتماله؛ يتم تحديث البيانات لجميع 
التقارير $a‏ واحدةً في الأسبوع وإتاحتها على لوحات المعلومات. وفي نشر Jal‏ 
اختارت Ux Electrabel‏ تدريجيًا يبدأ بتقارير بسيطة وينتقل إلى تقارير أكثر تعقيدًا. 
وقد احتاج التقريرٌُ الأول بضعة أسابيع لبنائه» ثم جاءت بقية التقارير بشكل أسرع. 
وتتضمّن النجاحات ما ياي: 

- تستغرق البياناث التي استغرقت يومين للتحضير الآن ساعتين فقط. 

quas -‏ رؤية بيانية لفواتير وتكوين الفواتير للعملاء 828. 


- تقرير إدارة عبء العمل من قبل الفرق التشغيلية. مما هكن المديرين من تقييم أعباء 


فريق العمل على أساس أسبوعي أو طويل الأجل وهكنهم من إجراء تعديلات Gis‏ لذلك. 


يقول نوب: «لقد قمنا بتحسين كفاءة أعمالنا بشكلٍ oS‏ ويمكننا Goal‏ بيانات 
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عالية الجودةء وتقارير بشكلٍ أكثر تكرارًا وبتكلفة Jal‏ بكثير. وإذا كانت الشركة بحاجة 
إلى تجميع البيانات من مصادر متعددة؛ فهذا أيضًا من السهولة بمكان. كما يمكن إنشاءٌ 
تقارير مرئية» استنادًا إلى هذه البيانات» خلال بضعة ebi‏ أو حتى بضع ساعات». 


ويضيف: Sp‏ الشركة lala‏ لمواصلة توسيع رؤيتها في السلوك الرقمي لعملائها. 
والجمع بين البيانات من تحليلات الويب والبريد الإلكتروني والوسائل الإعلامية للتواصل 
الاجتماعي مع البيانات من أنظمة النهاية الخلفية. وف النهاية؛ نحن نريدٌ استبدال 
جميع التقارير التي تحتاج إلى عمل مكثف بتحليلات SAS‏ المرثية». وكما يقول نوب 
مضيقًا: إن مرونة تحليلات SAS‏ اممرئية أمرٌ بالغ الأهمية لإدارته: «وهذا سيتيح UJ‏ 
امزيد من الوقت gha‏ للتحَدّيات الأخرى. ونريد Ul‏ أن نجعل هذه الأداة متاحة 
على أجهزتنا المحمولة. وسيس مح ذلك ممديري الحسابات لدينا باستخدام التقارير 
الحديثة والثاقبة والقابلة للتكيّف عند زيارة العملاء. كما يوجد لدينا diis‏ لإعداد 
التقارير الموجهة نحو المستقبل للقيام Sa‏ ما نحتاجه». 

أسئلة للمناقشة: 


-١‏ اذا تعتقدٌ أن شركات إمدادات الطاقة من بين المستخدمين الرئيسيين لأدوات 
تصوير المعلومات؟ 

-Y‏ كيف استخدم Electrabel‏ تصوير المعلومات للنسخة الواحدة من الحقيقة؟ 

e ما التحديات التي واجهوها؟ وماذا كان الحل المقترح؟ وما النتائج التي‎ -۴ 
الحصولٌ عليها؟‎ 
Source: SAS Customer Story, "Visual analytics helps energy supplier make 
better connections" at http://www.sas.com/en us/cus-tomers/electrabel-be. 


html (accessed July 2016). Copyright © 2016 SAS Institute Inc., Cary, NC, 
USA. Reprinted with permission. All rights reserved. 


ما الذي تبحث عنه في لوحة المعلومات: 


على الرغم من اختلاف أداء لوحات المعلومات والأطر الأخرى لتصوير المعلومات؛ فإنها 
جميعها تشترك في بعض الخصائص الشائعة للتصاميم. أولا: إنها جميعًا ملائمة لنظام ذكاء 
الأعمال الأكبر أو نظام قياس الأداء. وهذا يعني أنَّ البنية الأساسية الخاصة بهم جميعًا هي ذكاء 
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الأعمال أو بنية إدارة الأداء في النظام الأكبر. JS gias GE‏ لوحات المعلومات Asa‏ جيدًا 

وتصويرات المعلومات الأخرى بالخصائص التالية )2009 :(Novell,‏ 

- جميعها تستخدم مكوّنات بصرية (مثل: الرسومات AILI‏ وأشرطة el‏ وخطوط المؤشرات» 
والمقايبس» والأمتارء وإشارات المرور الضوئية)؛ لتسليط الضوء - في لمحة واحدة - على البيانات 
والاستثناءات التي class‏ اتخاذ إجراء. 

A5 -‏ جميعها ilid‏ للمستخدم: وهذا يعني أنها تتطلًب ÁA‏ الأدنى من التدريب وتكون سهلة 
الاستخدام للغاية. 

- جميعها تجمّع البيانات من مجموعة متنوعة من الأنظمة إلى عَرْضٍ Als‏ وموجز ومُوحَّدِ للأعمال. 

- إنها جميعًا تكن من التمحيص أو الانتقال إلى مصادر البيانات الأساسية أو التقارير؛ مما يوفر 
مزيداً من التفاصيل حول السياق الأساسي النُسبي والتقديري. 

på -‏ جميعها عرضًا حيويًا للعالم الحقيقي مع تحديث البيانات في الوقت المناسب؛ مما يتبح 
للمُستخدم النهائي مواكبة أحدث التغييرات في النشاط التجاري. 

- تتطلّب جميعها القليل من الترميز المُخصّص - إن وجد - لتنفيذه ونشره وصيانته. 


أفضل الممارسات في تصميم لوحة المعلومات: 

إن ترديد العقارات ممقولة «الموقع, الموقع, الموقع» تُظهر بوضوح أن السّمة الأكثر أهمية لجزء 
من الملكية العقارية هي المكان الذي a‏ فيه. Ul‏ بالنسبة إلى لوحات المعلومات فالترديدٌُ يكون 
«البيانات» البيانات» البيانات». فغالبًا ما تكون البيانات؛ هي أحد أهم الأشياء التي يجب أخذها في 
الاعتبار عند تصميم لوحات المعلومات )2007 (Carotenuto,‏ حتى إذا كان مظهرٌ لوحة القيادة 
يبدو احترافيًاه وممتعاً من الناحية الجمالية. ويتضمّن رسومًا بيانية وجداول تم إنشاؤها وفقًا معايير 
التصميم ال مرئي المقبولة؛ فمن all‏ أيضًا أن تسأل عن البيانات: هل هي موثوقة؟ هل هي في 
الوقت المناسب؟ هل هناك أي بيانات مفقودة؟ هل هي ثابتةٌ عبر جميع لوحات المعلومات؟ فيما 
يلي بعص من أفضل الممارسات القائمة على الخبرة في تصميم لوحة المعلومات (2008 (Radha,‏ 


مؤشرات الأداء الرئيسية مع معايير الصناعة: 


يرغب العديدٌ من العملاء في وقت ما في معرفة ما إذا كانت المقاييس التي يقيسونها هي 
المقاييس الصحيحة التي يجبٌ مراقبتها. وفي بعض الأحيان؛ يكتشف العملاءٌ أن المقاييس التي 
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يتتبعونها ليست هي المقاييس اللازم تتبُعها. إن إجراء تقييم للثغرات مع معايير الصناعة يجعلك 
تتوافق مع أفضل الممارسات في المجال. 
CA‏ مقاييس لوحة المعلومات مع البيانات الوصفية السياقية: 
في i$‏ من الأحيان عندما يتم تقديم تقرير أو لوحة معلومات/ بطاقة نتائج مرئية لمستخدمي 
الشركات؛ es‏ هناك أسئلةٌ بدون إجابة. وفيما يلي بعض الأمثلة على ذلك: 
- ما مصدر هذه البيانات؟ 
- في أثناء تنزيل مستودع البيانات» ما النسبة ايمئوية للبيانات التي تم رفضها أو واجهت مشكلات 
جودة البيانات؟ 
- هل eX‏ لوحة المعلومات معلومات «جديدة» أم معلومات «قدهة»؟ 
- متى كانت آخر مرة تمّ فيها ados‏ مستودع البيانات؟ 
- ومتى Rura‏ تحديثه Sly‏ 
- هل كان من شأن (Sl‏ صفقة عالية القيمة تحريف الاتجاهات العامة المرفوضة ejas‏ من عملية التنزيل؟ 


gåva‏ من صحة تصميم لوحة المعلومات بواسطة أخصائي القابلية للاستخدام: 
في معظم بيئات لوحة المعلومات؛ يتم تصميمُ لوحة المعلومات بواسطة Las‏ أدوات 
دون الأخذ في الاعتبار مبادئ قابلية الاستخدام. وعلى الرغم من أن مستودع البيانات يكون 
جيد التصميم وقادراً على أن يُحقّق Fol‏ جيدًا؛ إن العديد من مُستخدمي الأنشطة التجارية لا 
يستخدمون لوحة ا معلومات؛ نظراً لعدم مواءمتها مع المستخدمين (وفقاً لاعتقادهم السائد)؛ مما 
يؤدي إلى سوء اتخاذ بنية أساسية وإلى مشكلات في إدارة التغيير. ويمكن أن يؤدي التحقق Gaahl‏ 
من تصميم لوحة المعلومات بواسطة أخصائي قابلية الاستخدام إلى تخفيف هذه المخاطرة. 
إعطاء أولويات وترتيب التنبيهات/ الاستثناءات المتدفقة إلى لوحة المعلومات: 
بسبب وجود أطنان من البيانات الخام؛ فمن الأهمية بمكان وجوذ آلية لدفع الاستثناءات/ 
السلوكيات المهمة بشكلٍ استباقي إلى مستهلي المعلومات. ومن الممكن تقنينُ قاعدة الأعمال 
التي تضبط dad‏ التنبيه محل الاهتمام. كما يمكن أن ex‏ ترميزها في برنامج» باستخدام الإجراءات 
à SAI‏ في قواعد البيانات» والتي يمكنها الظهورٌ من خلال جداول الحقائق واكتشاف الأنماط 
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التي تحتاج إلى انتباه فوري. وبهذه الطريقة» تعثر المعلومات على مس تخدم الأعمال في مقابل 
مستخدم الأعمال الذي يتفحص جداول الحقائق لظهور DLÙ‏ الحرجة. 


إثراء لوحة المعلومات بتعليقات مستخدم الأعمال: 

عندما يتم تقديمٌ نفس لوحة ا معلومات إلى عدة مستخدمين؛ فيمكن توفي مربع نص صغير 
يمكنه التقاط التعليقات من وجهة نظر Gl‏ مُستخدم نهائي. وبهذا هكن غالبًا وضع علامة على لوحة 
المعلومات لوضع المعلومات في سياقها؛ مع إضافة وجهة النظر إلى KPIS‏ المهيكلة التي يتم تقدهها. 


تقديم المعلومات في ثلاثة مستويات مختلفة: 

GS‏ تقديم المعلومات في ثلاث طبقات حسب تقسيمات المعلومات: مستوى لوحة المعلومات 
المرئية» ومستوى التقرير الثابت» ومستوى مكعب الخدمة الذاتية. hueg‏ يتنقل المستخدم في لوحة 
المعلومات» يمكن تقديم مجموعة بسيطة من 8 إلى KPIS W‏ مما يعكس انطباعًا حول ما يجري 
بشكلٍ جيد وما هو غير جيد. 


اختيار البنية المرئية الصحيحة باستخدام مبادئ تصميم لوحة المعلومات: 

في عَرْض المعلومات على لوحة المعلومات؛ يتم تقديمٌ بعض المعلومات بشكل أفضل باستخدام 
شريط الرسوم البيانيةء وبعضها يكون أفضل مع المخططات البيانية للسلاسل الزمنيةء وعند عَرْض 
الارتباطات» يكون مربع التبعثر هو الأفضل. وفي بعض الأحيان مجرد تقديم المعلومات كجداول 
بسيطة يكون AST‏ فاعلية. وجرد أن يتمّ توثيق مبادئ تصميم لوحة المعلومات بشكلٍ quo‏ 
يمكن لجميع المطوّرين الذين يعملون على الواجهة الأمامية الالتزام بنفس المبادئ في أثناء تقديم 
التقارير ولوحة المعلومات. 


توفير التحليلات الإرشادية: 

في منظمة نموذجية؛ يمكن للمستخدمين من رجال الأعمال أن يكونوا على مستويات مختلفة من 
النضج التحليلي. كما يمكن استخدامٌ إمكانية لوحة المعلومات لتوجيه مستخدم الأعمال «متوسط 
المستوى» إلى الوصول إلى نفس مسار التنقل الذي يسلكه مستخدمٌ الأعمال المُحنّك بطريقة تحليلية. 
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أسئلة مراجعة على القسم MY‏ 

-١‏ ما هي لوحة المعلومات؟ وماذا هي منتشرة جداً؟ 

-Y‏ ما هي عناصرٌ الرسوم البيانية المُستَخدّمة ole‏ في لوحات المعلومات؟ ولماذا؟ 
-Y‏ اذكر مع الشرح الطبقات الثلاث من المعلومات المصوّرة على لوحات اممعلومات. 
-٤‏ ما هي الخصائص المشتركة للوحات المعلومات وغيرها من المعلومات ال مرئية؟ 
0- ما هي أفضل الممارسات في تصميم لوحة القيادة؟ 


تلخيص لأهم نقاط الفصل: 

- أصبحت البيانات واحدةً من أكثر الأصول a‏ لمنظمات اليوم. 

da -‏ البيانات هي العنصر الرئيسي GY‏ مبادرة ذكاء أعمالء وعلم البيانات ومبادرة تحليلات الأعمال. 

- على e‏ من أن القيمة المقترحة لها لا هكن إنكارهاء وللوفاء بوعودهاء يجبٌ أن تلتزم البيانات 
ببعض المقاييس الأساسية للاستخدام والجودة. 

gås -‏ البيانات (المعطاة في صورة مفردة) إلى مجموعة من الحقائق التي يتم الحصولٌ Žale lasle‏ 
كنتيجة للتجارب أو المشاهدات أو المعاملات أو الخبرات. 

- عند أعلى مستويات الغموض؛ ASE‏ تصنيفٌ البيانات على أنها مهيكلة وغير مهيكلة. 

- لا تكون البيانات في شكلها الأصلي/ الخام جاهزةً Bale‏ لتكون مفيدةً في مهام التحليلات. 

dad -‏ المعالجة المُسبّقة للبيانات lazos Aaa daga‏ للوقت؛ ولكنها ضرورية في تحليلات الأعمال. 

- يعرف Las]‏ على أنه مجموعةٌ من التقنيات الرياضية لتوصيف وتفسير البيانات. 

9S4 -‏ تصنيف الأساليب الإحصائية على أنها GI‏ وصفية أو استنتاجية. 

S -‏ الإحصائيات بشكل عام والإحصائيات الوصفية بشكلٍ خاص جزءً! bga‏ من تحليلات ذكاء 
الأعمال وتحليلات الأعمال. 

od -‏ استخدامٌ طرق الإحصاء الوصفي لقياس النزعة ال مركزيةء أو «clas‏ أو شكل مجموعة بيانات معينة. 

- قد يكون land‏ وخاصةً الانحدار «call‏ هو 51 تقنيات التحليلات شهرةٌ واستخدامًا في الإحصاءات. 

- يُنظر JI‏ من الانحدار الخطي والانحدار اللوجستي على أنهما النوعان الرئيسان من الانحدارات في الإحصاءات. 

- يُعرّف الانحدار اللوجستي كخوارزمية تصنيف قائمة على الاحتمالية. 
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C555 -‏ السلسلة الزمنية على أنها سلس Al‏ من نقاط البيانات odia‏ يتم قياسها وتسجيلها في 
نقاط متتالية من الزمن متباعدة على فترات زمنية مُوحّدة. 

ds -‏ التقريرُ أيّ عملية dols‏ من صُنع الإنسان تمّ تحضيرها بغرض معين؛ لتوصيل المعلومات 
بصيغة قابلة للتقديم أو العرض. 

dad -‏ تقريرٌ الأعمال مستنداً مكتوباً يحتوي على معلومات alis‏ بأمور الأعمال. 

à] -‏ مفاتيح el‏ تقرير تجاري ناجح؛ هي: الوضوح, والإيجان والاكتمال والصحة. 

- يعد التصويرٌ dl‏ للبيانات؛ هو استخدام التمثيلات المرئية؛ لاستكشاف البيانات وفهمها وتوصيلها. 

- قد يكون مخطط البياني الأبرز للمعلومات ف الماضى؛ هو ذلك الذي طوّره «Charles J. Minard‏ 
والذي صوّر Ele‏ الخسائر التي تكبّدها جيش نابليون في الحملة الروسية عام AM‏ 

os -‏ أنواعٌ الرسوم البيانية الأماسية الرّسم البياني الخَطّيء وشريط الرسم البياني» والرسم 
البياني الدائري. 

- غالبًا ما يتم اشتقاق الرسوم البيانية المتخصصة من المخططات الأساسية كحالات استثنائية. 

- إن تقنيات وأدوات عرض البيانات تجعل من مستخدمي تحليلات الأعمال وأنظمة ذكاء الأعمال 
أفضل مستهلكين للمعلومات. 

- تُعرّف التحليلات المرئية lib‏ مزيجٌ من التصوير والتحليلات التنبؤية. 

csl -‏ ازديادُ الطلب على التحليلات البصرية إلى cale‏ حجم البيانات سريع النمو إلى فمو Jla‏ 
في استثمارات أنظمة التصوير ذات الكفاءة العالية. 

- توفر لوحات المعلومات عروضاً مرئيةً لمعلومات مهمة يتم دَمْجُها وترتيبها على شاشة واحدة؛ حتى 
يمكن استيعاب تلك المعلومات في a‏ واحدة والتعمّق فيها بسهولة واستكشافها بشكل أكبر. 


مصطلحات أساسية: 





التحليلات جاهزة | تصوير البيانات الانحدار الخطي أبيانات النسبة 





الوسط الحسابي Em‏ الانحدار اللوجيستي me‏ 





box-and-whiskers plot 





الإحصائيات الوصفية | متوسط الانحراف المطلق | التقرير 


box plot‏ | تخفيض الأبعاد الوسيط اربع التبعثر 
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التحليلات جاهزة تصوير البيانات الانحدار الخطي بيانات النسبة 
الرسم البياني الفقاعي zia‏ المنوال الانحراف 

تقرير الأعمال die‏ الأداء بيانات اسمية الانحراف المعياري 
بيانات فئوية الحوسبة تحليلات على الإنترنت | الإحصاء 

لمركزية eat‏ التكراري |امعالجة (OLAP)‏ نرد القصصي 

لارتباط لإحصاء الاستنتاجي | بيانات ترتيبية بيانات مهيكلة 

لوحات المعلومات slo‏ الرئيسي ا مربعات الصغرى العادية | التنبق بالسلاسل الزمنية 
معالجة المسبقة OLUV‏ | مؤشر (OLS) (KPI)‏ بيانات غير مهيكلة 
جودة البيانات ا معرفة الرسم البياني الدائري | اختيار المتغير 

os‏ البيانات التفرطح gol‏ لتباين 

تصنيف البيانات els‏ النطاق التحليلات المرئية 














أسئلة للمناقشة: 


-١‏ كيف تصف أهمية البيانات في التحليلات؟ هل هكننا التفكيرٌ في التحليلات بدون بيانات؟ اشرح. 

-Y‏ بالنظر إلى التعريف الجديد والواسع لتحليلات الأعمال؛ ما هي المدخلات وا مخرجات الرئيسية 
لاستمرارية التحليلات؟ 

۳- من أين db‏ بيانات تحليلات النشاط التجاري؟ وما هي مصادرٌ وطبيعة تلك البيانات الواردة؟ 

£- ما هي المقاييس الأكثر استخدامًا في البيانات الجاهزة للتحليلات؟ 

0- ما هي الفئات الرئيسة للبيانات؟ وما هي أنواعٌ البيانات التي يمكن استخدامها في ذكاء الأعمال والتحليلات؟ 

1- هل Sd‏ استخدامٌ نفس تمثيل البيانات لجميع نماذج التحليلات (بمعنى: هل تتطلّب نماذج 
التحليلات المختلفة مخططًا مختلقًا لتمثيل البيانات)؟ وماذا؟ أو اذا Sy‏ 

ISU -V‏ لا تكون البيانات الأصلية/ الأوّلية LE‏ للاستخدام بسهولة بواسطة مهام التحليلات؟ 

-A‏ ما هي الخطوات الرئيسة لمعالجة البيانات؟ اذكر مع الشرح أهميتها في التحليلات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري nr‏ 


الفصل الثاني 


H 


3- ماذا يعني تنظيف/ فرك البيانات؟ وما هي الأنشطة التي يتم أداؤها في هذه المرحلة؟ 

-٠‏ يكن تطبيق تخفيض البيانات على الصفوف (أخذ العينات) و/ أو الأعمدة (اختيار متغير). 
Gal‏ أكثر تحديًا؟ اشرح. 

M‏ ما هي العلاقة بين الإحصائيات وتحليلات الأعمال (مع الأخذ في الاعتبار مكانة الإحصاءات 
من تصنيف تحليل الأعمال)؟ 

-VY‏ ما هي الاختلافات الرئيسة بين الإحصاء الوصفي والاستقرائي؟ 

-Y*‏ ما هو fa box-and-whiskers plot‏ وما هي أنواع المعلومات الإحصائية التي تمثلها؟ 

-٤‏ ما هي خصائصٌ الشكل SI‏ شيوعًا لوصف توزيع البيانات؟ 

-Vo‏ اذكر مقاييس النّزعة المركزية للإحصاءات الوصفيةء مع تعريف موجز لكل مقياس. 

Vi‏ - ما هي أوجه الشبه والاختلاف بين الانحدار والارتباط؟ 

۷- اذكر مع الشرح الخطوات الرئيسة لمتابعة التطور في نموذج الانحدار الخطي. 

-MA‏ ما هي أكثر الافتراضات الواضحة شيوعًا للانحدار الخطي؟ وما الذي يلزم لنماذج الانحدار 
في مقابل هذه الافتراضات؟ 

14- ما هي أوجه الشبه والاختلاف بين الانحدار الخطي والانحدار اللوجستي؟ 

-٠٠‏ ما هي السلاسل الزمنية؟ وما هي تقنيات التنبؤ الرئيسية لبيانات السلاسل الزمنية؟ 

-Y‏ ما هو تقريرٌ العمل؟ ولماذا يتم الاحتياجُ إليه؟ 

-YY‏ ما هي أفضل الممارسات في إعداد تقارير الأعمال؟ وكيف هكننا جَعْل تقاريرنا تتميّز عن غيرها؟ 

-YY‏ اشرح عملية دورة الإدارة مع التعليق على دور تقارير الأعمال. 

-YE‏ اذكر مع الشرح الفئات الرئيسية الثلاثة لتقارير الأعمال. 

-Yo‏ اذا أصبح تصويرٌ المعلومات محوريًا في تحليلات ذكاء الأعمال وتحليلات الأعمال؟ وهل 
هناك فرق بين تصوير المعلومات والتحليلات المرئية؟ 

-YT‏ ما هي الأنواع الرئيسة من الرسوم/ المخططات البيانية؟ lbg‏ يوجد الكثير منها؟ 

۷- كيف يمكنك تحديدٌ الرسم البياني المناسب JS)‏ مهمة؟ اشرح jig‏ إجابتك. 

-YA‏ ما هو الفرق بين تصوير المعلومات والتحليلات المرئية؟ 

9 اذا يجب أن يكون السرد القصصي ja‏ من إعدادك للتقارير وتصويرك للبيانات؟ 
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-Y‏ ما هي لوحات المعلومات؟ log‏ تعرض؟ 

bn‏ هي أفضل الممارسات في تصميم لوحات المعلومات الغنية بالمعلومات؟ 

-YY‏ هل iis‏ أن لوحات المعلومات/ الأداء موجودة لتبقى؟ أم هي على وشك التقادم؟ وبرأيك 

ماذا ستكون الموجة الكبيرة التالية في ذكاء الأعمال وتحليلات الأعمال؛ من حيث تصوير 
البيانات/ المعلومات؟ 
تمارين 
جامعة تيراداتا وغيرها من التمارين اليدوية الأخرى 

-١‏ قم بتنزيل بيانات «سلوك التصويت» ووصف البيانات المختصر من موقع الكتاب على الإنترنت. 
هذه مجموعة بيانات تمّ تجميعها يدويًا من المقاطعات في جميع أنحاء الولايات المتحدة. 
تتم معالجة البيانات Esja‏ أيْ: يتم إنشاء بعض المتغيرات المشتقة. وتتمثل مهمتك في إجراء 
معالجة مسبقة للبيانات من خلال تحديد الخطأ والشذوذ واقتراح الإصلاحات والحلول. وفي 
النهاية؛ يجب أن يكون لديك إصدارٌ جاهرٌ للتحليلات لهذه البيانات. وبمجرد اكتمال معالجة 
المسبقة. اسحب هذه البيانات إلى Tableau‏ (أو إلى أداة برمجية أخرى لتصوير البيانات)؛ 
لاستخراج معلومات مرئية مفيدة منها. وللقيام بذلك؛ قم subs,‏ الأسئلة والفرضيات ذات 
الضّلة (ابتكر 4535 منها على (UI‏ وقم بإنشاء تصويرات ملائمة تتعامل مع تلك الأسئلة ل 
«اختبارات» تلك الفرضيات. 

-Y‏ قم بتنزيل Tableau‏ (من على «tableau.com‏ باتباع الإرشادات الأكاديمية لتنزيل البرامج 
المجانية من على موقعها). باستخدام مجموعة البيانات Visualization MFG Sample‏ 
(المتاحة على ملف Excel‏ على موقع هذا الكتاب)» أجب عن الأسئلة التالية: 

-١‏ ما هي العلاقة بين إجمالي إيرادات شباك التذاكر والمعلمات الأخرى المتعلّقة بالفيلم 
الواردة في مجموعة البيانات؟ 

-Y‏ كيف تختلف هذه العلاقة عبر سنوات مختلفة؟ إعداد تقرير مكتوب gò‏ مظهر احترافي 
يتم تحسينه باستخدام لقطات من نتائجك الرسومية. 

«LUI ابحث عن مقالة تتناول طبيعة‎ .teradatauniversitynetwork.com انتقل إلى‎ -Y 
Je وإدارة البيانات» و/ أو تقنين البيانات من حيث صلتها بذكاء الأعمال والتحليلات» ثم‎ 
محتوى المقالة بشكل نقدي.‎ 
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الفصل الثاني 


€- انتقل إلى مستودع بيانات Ae gamo 235-9 (archive.ics.uci.edu/ml/datasets.html) UCI‏ 
Sau‏ من البيانات تحتوي على US‏ من القيم الرقمية والقيم الاسمية. باستخدام Microsoft‏ 
Excel‏ أو أي برنامج إحصافي آخر: 

-١‏ قم بحساب وتفسير مقابيس التّزعة مركزية لكل متغير. 
-Y‏ قم بحساب وتفسير مقاييس التشئَّت/ الانتشار لكل متغير. 

0- انتقل إلى مستودع بيانات «(archive.ics.uci.edu/ml/datasets.html) UCI‏ ود 
مجموعتين من البيانات» إحداهما ل التقدير/ الانحدار والأخرى للتصنيف. باستخدام 
Microsoft Excel‏ أو أيّ برنامج إحصافي آخر: 

-١‏ قم بتطوير وتفسير نموذج انحدار خطّي. 
-Y‏ قم بتطوير وتفسير نموذج انحدار لوجستي. 

1- انتقل إلى موقع KKDnuggest.com‏ وتعرّف على مجموعة موارد التحليلات المتاحة على هذه 
البوابة. ثم 4 مقالةً أو )43 بيضاء أو نضًا للمقابلة يتناول طبيعة البيانات» و/ أو إدارة 
البيانات, و/ أو تقنين البيانات؛ من حيث صلتها بذكاء الأعمال وتحليلات الأعمال. ثم Jo‏ 
محتوى المقالة بشكلٍ نقدي. 

Jäs! .[^Ihe Perceptual Edge" (perceptualedge.com)] انتقل إلى مُدوَّنة ستيفن فيو‎ -V 
قسم‎ 332 .dundas.com من هذه الأمثلة. اذهب الآن إلى‎ bás إلى قسم ”أمثلة“. اقرأ‎ 
سيعرض لك مجموعةٌ‎ "Digital Dashboard" انقر على‎ U3 في الموقع. بعد‎ "Gallery" 
متنوعة من العروض التوضيحية ا مختلفة للوحة المعلومات. قم بتشغيل اثنين من هذه‎ 
العروض التوضيحية.‎ 

-١‏ ما هي أنواع المعلومات والمقاييس التي تظهر في العروض التوضيحية؟ وما هي أنواع 
الإجراءات التي يمكنك اتخاذها؟ ١‏ 

-Y‏ باستخدام بعض المفاهيم الأساسية من نقد gS Few‏ بوصف بعض نقاط التصميم الجيدة 
ونقاط التصميم السيئة للعروض التوضيحية. 

-A‏ قم بتنزيل أداة لتصوير المعلومات. مثل Tableau‏ أو QlikView‏ أو .Spotfire‏ إذا م يكن لدى 
مدرستك اتفاقية تعليمية مع هذه الشركات؛ فستكون النسخة التجريبية كافية لهذا التمرين. 
استخدم بيانات ك الخاصة (إذا كان لديك (Sl‏ منها) أو استخدم إحدى مجموعات البيانات 
التي gb‏ مع الأداة aleg)‏ ما تحتوي على مجموعة بيانات واحدة أو أكثر لأغراض العرض 
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التوضيحي). قم بدراسة البيانات» وافترض مش كلتين من ابتكارك من مشكلات الأعمال» 
واستخدم التصوير البياني للبيانات لتحليل وعرض هاتين المشكلتين» ثم اقترح حلا محتملًا لهما. 

4- انتقل إلى: .teradatauniversitynetwork.com‏ ابحث عن ”مشروع برنامج ."Tableau‏ اقرا 
الوصفء نقذ el‏ ثم أجب عن الأسئلة. 

1۰- انتقل .teradatauniversitynetwork.com : JI‏ ابحث عن مهام تحليلات SAS‏ المرئية. 
باستخدام المعلومات والإرشادات من نوع خطوة بخطوة المتوفرة في المهمة؛ قم بتنفيذ 
التحليل على أداة SAS Visual Analytics‏ (وهو نظا يدعم الويب ولا يتطلب ca Gl‏ 
محلي). أجب عن الأسئلة المطروحة في المهمة. 

-١‏ ابحث عن مقالتين على الأقل (إحداهما às‏ صحفي والآخر 355 (slàn d‏ تتحدثان عن 
سرد القصصء وخصوصًا في سياق التحليلات (أيْ: سرد القصص القائم على البيانات). اقرأ كلا 
من المقالة والورقة ثم gÊ‏ بتحليلهما Sio‏ نقديء واكتب تقريرًاً يعكسٌ فهمك وآراءك حول 
أهمية السرد القصصي في ذكاء الأعمال وتحليلات الأعمال. 

-VY‏ انتقل إلى Data.gov‏ - وهي بوابة بيانات ترعاها حكومة الولايات المتحدة - والتي تحتوي 
Be PIU‏ من مجموعات البيانات حول مجموعة متنوعة من الموضوعات التي تتراوح 
من dole JI‏ الصحية إلى التعليم» والمناخ والسلامة العامة. اختر موضوعًا يشغل بالك كثيرا. 
انتقل من خلال المعلومات الخاصة بهذا الموضوع والشرح المقدَّم على الموقع. استكشف 
إمكانيات تنزيل البيانات» واستخدم أداتك المفضلة للتصوير البياني للبيانات لإنشاء معلومات 
ومقاطع مرئية ذات معنّى خاص بك. 


مهام فريق ومشروعات لعب الأدوار: 

-١‏ يبدأ التحليل بالبيانات. إن تحديد البيانات ذات ALAI‏ والوصول إليها والحصول عليها ومعالجتهاء 
هي lali eal‏ في أيّ دراسة تحليلية. بصفتك LÀ S‏ يتم تكليفك بالبحث عن بيانات واقعية 
كبيرة ها يكفي lal)‏ من مؤسستك الخاصةء وهذا هو الخيار الأفضلء أو من الإنترنت والتي يمكن 
أن lus‏ ببحث بسيطء أو من روابط البيانات المنشورة على (KDnuggets.com‏ والتي لديها 
عشرات الآلاف من الصفوف وأكثر من ٠١‏ متغيرًا لتتناول وتوثق المشروع الشامل للمعالجة 
المسبقة للبيانات. في معالجتك للبيانات؛ 335 الشذوذات والتناقضات باستخدام طرق ومقاييس 
الإحصاء الوصفيء واجعل تحليلات البيانات جاهزةً. قم بإعداد قائمة مع التبرير لخطوات 
معالجتك المسبقة وقراراتك في تقرير شامل. 
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(dundas.com, idashboards.com, enterprise-dashboard.com) انتقل إلى موقع ويب‎ -Y 
من الأمثلة على‎ Bae هذه المواقع‎ si والمزؤّد بمعلومات لوحة المعلومات المعروفة جيدًا؛ إذ‎ 
(مثل: الرعاية الصحية» أو‎ Ama لوحات التحكم التنفيذية. وبصفتك فريقاً اختر صناعةً‎ 
الخدمات المصرفية, أو الخطوط الجوية). 235 موقع بعض من الأمثلة للوحات معلومات‎ 
هذه الصناعة. قم بِوَصْف أنواع المقاييس الموجودة في لوحات المعلومات. ما هي أنواع‎ 
شاشات العرض التي يتم استخدامها لتوفير المعلومات؟ وباستخدام ما تعرفه عن تصميم‎ 
لورقة لوحة معلومات لهذه المعلومات.‎ Jus لوحة ا معلومات» قم بتوفير نموذج‎ 

-Y‏ انتقل إلى .teradatauniversitynetwork.com‏ ومن هناك؟ انتقل إلى مصادر بيانات جامعة 
أركنساس. اختر واحدة من مجموعات البيانات الكبيرة وقم بتنزيل عدد كبير من السجلات 
(قد يتطلّب ذلك منك كتابة عبارة SQL‏ التي تقوم بإنشاء المتغيرات التي تريد تضمينها في 
مجموعة البيانات). اطرح ٠١‏ أسئلة على الأقل يمكن معالجتها باستخدام تصوير المعلومات. 
ثم باستخدام أداتك المفضّلة لتصوير البيانات (ولتكن (Tableau‏ حلل البيانات ثم قم بإعداد 
تقرير Jaik‏ يتضمن لقطات شاشة وصور مرئية أخرى. 
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الفصل الثالث 
التحليلات الوصفية (Y)‏ 
ذكاء الأعمال ومستودعات البيانات 

أهداف التعلم: 
- فهم التعريفات والمفاهيم الأساسية لمستودعات البيانات. 
- فهم فنيات مستودعات البيانات. 
- وَضْف العمليات المُستخدّمة في تطوير وإدارة مستودعات البيانات. 
- شرح عمليات مستودعات البيانات. 
- شرح دور مستودعات البيانات في دعم القرار. 


t -‏ تكامل البيانات» وعمليات الاستخراجء والتحويل والتنزيل ETL)‏ 





e4 -‏ جوهر إدارة slol‏ الأعمال (BPM)‏ 
els -‏ بطاقة الأداء المتوازن وستة سيجما els‏ قياس الأداء. 

لقد كان مفهومٌ مستودعات البيانات موجودًا منذ أواخر الثمانينيات. pia‏ هذا الفصل 
gelaai‏ لنوع مهم من قواعد البيانات» CA ad‏ مستودع البيانات» والذي يُستَخِدّم LaL‏ لدعم 
القرار ويوفر الأساس المعلوماتي لتحسين القدرات التحليلية. وسنناقش مفاهيم تخزين البيانات 
وما يرتبط بذلك» وكذلك إدارة elal‏ الأعمال في الأقسام التالية. 


1-٠‏ مقال افتتاحي: استهداف الاحتيال الضريبي مع ذكاء الأعمالء ومستودعات البيانات: 

cis‏ على الحكومات أن تعمل don‏ لمنع التهرّب الضريبيء والذي يؤدي إلى تناقص ملحوظ 
في عائداتها. ففي عام pY VY‏ نجحت lo]‏ العائدات الداخلية (IRS)‏ في إجهاض محاولات 
من مجهولين» كانت تستهدف خداع الحكومة الفيدرالية في مبلغ Y, YE‏ مليار دولار من مبالغ 
الضرائب. ومع ذلكء وفي نفس العام» خسرت مصلحة الضرائب الأمريكية مبلغ 0 A,‏ مليار دولار 
على مطالبات تم إدراجُها في Cs‏ لاحق تحت بند التهرّب الضريبي. 
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الفصل الثالث 


كما تخسر الولايات الأمريكية La]‏ الكثير من الأموال عندما يستخدم المحتالون أرقام الضمان 
الاجتماعي المسروقة» ونماذج W-2‏ وغيرها من المعلومات الشخصية لتقديم مطالبات مزيفة. وقد 
al‏ هذا النوع من الجرائم في السنوات الأخيرة معدل يُنذر بالخطر. يقول بيتر فرانشوت, المراقب 
UL‏ بولاية ماريلاند: «لقد سمع US‏ الأمريكيين تقريبًا عن سرقة الهوية؛ لكن القليل منهم فقط 
كان على دراية بهذه الزيادة الهائلة في تزوير العائدات الضريبية. إن هذه المشكلة المزعجة تؤثر 
على S‏ دول العالم. وهذا ما يعرف - حرفيًا - بالسطو الممنهج على أموال دافعي الضرائب». 

في ولاية ماريلاند؛ كان الأشخاص المتهمون بتزييف مطالبات الاسترداد أعضاءً في فريق الكشف 
عن العائد المشكوك فيه .(QRDT)‏ ومثل نظرائهم في العديد من الولايات الأخرى» يستخدم 
هؤلاء الخبراء البرمجيات؛ لتحديد العوائد المشبوهة. ثم يقومون بعد ذلك بالتحقيق في العائدات 
لتسليط الضوء بدقة على الاحتيالي منها. 
التحدي: 

في الماضي؛ كانت ولاية ماريلاند تستخدم مقايبسٌ لفحص الإقرارات الضريبية واحدًا تلو الآخر. 
فإذا انّسَم العائدُ بصفات bakah‏ - مثل: نسبة معينة من الأجور المكتسبة إلى الأجور ا محتجزة 
- قامت البرمجيات بتعليق ذلك العائد لحين التحقيق فيه. ثم قام أعضاء QRDT‏ بالنظر في 
كل العائدات امعلقة؛ وذلك عن طريق مقارنة الأجر وامعلومات المحجوبة بالأرقام المقدّمة من 
نموذج W-2‏ الذي $3 استلامه من قبل صاحب العمل. كانت العملية كثيفة العمالة وغير فعالة. 
ومن أصل ما يقرب من A Y‏ مليون عائد ضريبي كانت تحصل عليه ميريلائد JS‏ عام eB‏ أعضاء 
فريق QRDT‏ بتعليق ٠٠٠٠١ dise‏ منها. ولكن تبَيّن أن معظم تلك العائدات كانت عائدات 
مشروعة. يقول آندي شاوفيل» مدير مكتب تقديرات الإيرادات لمراقبة حسابات ولاية ماريلائد: 
«لقد تبَيّن لنا أن “٠١‏ فقط من المموّلين كانوا مخادعين». 

في سنة نموذجية؛ أنقذت تلك العملية ولاية ماريلاند من سداد ما بين © إلى aga ٠١‏ 
دولار كمطالبات استرداد مزيفة. وعلى الرغم من نجاح ذلك؛ فإنها Jo ama i‏ متواضع» مع 
الأخذ بعين الاعتبار الموارد المرتبطة بالعملية وإزعاج دافعي الضرائب المخلصين الذين تم تحديد 
عوائدهم للتحقيق. يقول شاوفيل: «كان التفكير في أننا كنا نعلق ما بين 5٠٠٠١‏ و ٠٠‏ عملية 
استرداد للضرائب أمرًا so‏ لقد أردنا الحصول على هذه المبالغ المستردّة لدافعي الضرائب 
بشكل أسرع؛ إذ يعتمد الكثيرٌ من الناس على هذا الال ejas‏ من دخلهم». 
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الحل: 

احتاجت ماريلاند إلى عملية أكثر فعالية. كما احتاجت إلى إستراتيجيات جديدة لاستمرار 
السيطرة على المحتالين. يقول شاوفيل: «كانت جميع الولايات» وكذلك مصلحة الضرائب الداخلية 
5 يستخدمون جميعًا نفس المقاييس التي كنا نستخدمهاء ولا أعتقد أنه كان من الصعب على 
المجرمين معرفة الإجراءات الاحترازية التي نتبعها». i. eds‏ الحظ؛ حصلت ماريلاند مؤخرًا على 
سلاح جديدٍ 3 $9 ضد التهرّب الضريبي. في عام ١٠١۲م‏ عمل مراقب الخزينة في ماريلاند مع 
شركة Teradata of Dayton‏ بولاية أوهايى لتنفيذ مستودع بيانات Quas‏ لدعم مجموعة 
متنوعة من مبادرات الامتثال. 


وبينما كان المسؤولون يناقشون المبادرات التي يجب إطلاقها؛ طفت فكرةٌ واحدةٌ على السطح. 
تقول شارون بونارديء نائبة مراقب ولاية ماريلاند: «لقد قرّرنا أننا يجبٌ أن نعطي الأولوية 
لجهودنا الرامية إلى تعقب الاحتيال في استرداد الأموال». لذا بدأت الولاية العمل مع تيراداتا ومع 
شركة ASR Analytics‏ في بوتوماك بولاية ماريلاند؛ لتطوير عملية أفضل لعزل الإقرارات الضريبية 
الاحتيالية )2013 -(TempleWest,‏ 

يقول شاوفيل: «كانت الخطوة الأولى؛ هي تحليل بياناتنا وتعلّم ما هكن dals‏ عن الاحتيال». 
ومن بين الاكتشافات الأخرى؛ أظهر التحليلٌ أنه عندما يتم تعليق عائدات متعددة - حتى لأسباب 
مختلفة Gle‏ - فإنها JU‏ ما تكون لها سمات مشتركة. قامت الولاية ببناء قاعدة بيانات للسمات 
التي ië‏ الخصائص الاحتيالية للعائدات» وكذلك للسمات التي يتميّز بها الشرفاء. يقول شاوفيل: 
«لقد lilas‏ مع ASR‏ لوضع هذه المعلومات lis‏ وتطوير الانحدارات الخطيةء وبدلًا من النظر 
إلى المقاييس المنفردة بذاتها؛ شرعنا في تطبيق فكرة الجمع بين العديد من هذه المقاييس te‏ 
وكانت النتيجة صورةً أكثر دقة من حيث درجات الاختلاف للعائد الاحتيالي المعتاد. 

Ya os‏ من تعاقب العائدات الضعيفة واحدًا تلو الآخر؛ يُحدّد النظام الجديد مجموعات 
العائدات التي تبدو مشبوهةً لأسباب مماثلة. تجعل هذه الإستراتيجية عملية التحقيقات 323 
بشكل أسرع. ويُحدّد نظام التحليلات LAÍ‏ درجةً SJ‏ عائد؛ وذلك Lio‏ على مدى احتمالية 
كونه احتياليًا. ثم ينتج بعد ذلك قائمة ذات أولوية لتوجيه سَيْر عمل 0۸51. يقول شاوفيل: 
«نحن Sol Jass‏ على العائدات التي من الأرجح ألا تكون احتيالية؛ ولذا يمكننا إخراجها من AEB‏ 
الانتظار». ثم تعود العائدات الأكثر شبهةٌ للمراجعة مرةٌ أخرى. 
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النتائج: 

يقول بوناردي: «بفضل نماذج التحليلات هذه؛ يمكننا تقليل القيّم الموجبة الخاطئة, حتى لا 
نثقل على كاهل دافعي الضرائب الذين قدَّموا إقراراتهم الضريبية بدقة إلى الولاية». وبمجرد أن 
يزيل المحققون عائداتهم من 42 الانتظار؛ يصبح بإمكان دافعي الضرائب استرداد مطالباتهم 
التي حُصَّلّتَ منهم بالخطاً. 

وبفضل التقنية الجديدة؛ 353 QRDT g‏ تعليق ما يتراوح من ٠٠٠٠١‏ إلى ٥٠٠٠١‏ فقط من 
العائدات الضريبية» مقارنة ب ٠١٠٠٠١‏ في السنوات الماضية. يقول شاوفيل: «من بين كل هؤلاء 
الذين عملنا معهم حتى الآن؛ نحصل على نسبة دقة تصل إلى 719 تقريّا». ويُعَدُ ذلك تحسّنًا 
Ul)‏ مقارنة معدل النجاح التاريخي البالغ ×٠١‏ فقط. ويقول فرانشوت, المراقب JU‏ لماريلاند: 
«مجرد أن يتم daas‏ العائدات التي قد تكون احتياليةء هكن لفريق الخراء الممتحنين أن 
يراجعها بعناية» في cis‏ واحد؛ لإزالة تلك العائدات التي تثبت عدم شرعيتها. وبذلك تتحشّن 
العملية lax‏ بشكلٍ أفضل طوال الوقت». 

ds‏ أواخر مارس من نفس العام؛ ساعدت التحليلات المتقدّمة فريق QRDT‏ على استرداد 
حوالي ٠١‏ مليون دولار في موسم الإيداع الحالي. يقول شاوفيل: d»‏ ظل النظام القديم» كان هذا 
الرقم يبلغ حوالي Y‏ ملايين دولار في هذه المرحلة». ولا pasi‏ دور التقنية الجديدة فقط على 
تيسير عمل JS» QRDT‏ أسرع وأكثر كفاءة؛ ولكنها UE]‏ تساعد الفريق على التعامل مع عبء 
العمل الأكثر تعقيدًا. وعندما olj‏ المتهربون من الضرائب من جهودهم» لجأ فريق JI QRDT‏ 
شر إستراتيجيات جديدة ضدهم. فعلى سبيل JEU‏ في عام ١٠١۲م‏ تلقّى الفريق حوالي ٠١٠٠١‏ 
إخطار من دافعي الضرائب الذين C‏ سرقة هوياتهم. يقول شاوفيل: bo‏ لدينا ga‏ عمل 
جديد: وهو البحث عن أرقام الضمان الاجتماعي الخاصة بهم ومحاولة العثور على isl‏ حوادث 
تزوير قد تكون أرتكبّت معهم» Ad‏ هذا مستوّى جديدًا من الجهود التي تُكّملها هذه ا مجموعة 
الآن بدون موارد إضافية». 

وللمحافظة على مُخططات ضريبية أكثر تطوراً لا يقوم المحققون OVI‏ بفحص استمارات W-2‏ 
الحالية فحسب؛ بل يقومون أيًا بمقارنتها باستمارات نفس الممولين من السنوات السابقة؛ Eoo‏ 
عن التناقضات. ويضيف شاوفيل: «أصبحت التحقيقات أكثر تعقيدًا واستغراقًا لوقت أطول وإذا 
لم تتم مراجعة تلك الإجراءات بعناية؛ فستلاحقنا بلا شك بعض المشكلات الحقيقية». 
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أسئلة على المقالة الافتتاحية: 

-١‏ لماذا من المهمٌ لمصلحة الضرائب الأمريكية ولحكومات الولايات الأمريكية استخدام أدوات 
مستودعات البيانات» وأدوات ذكاء الأعمال في إدارة الدخل القومي؟ 

-Y‏ ما هي التحَدّيات التي تواجه ولاية ماريلاند فيما يتعلّق بالتهرب الضريبي؟ 

*- ما هو Jodl‏ الذي اعتمدوه؟ وهل توافق على طريقتهم؟ ولماذا؟ 

-E‏ ما هي النتائج التي حصلوا عليها؟ وهل نجح الاستثمار في (ذكاء الأعمال) ومستودعات البيانات؟ 

0- ما هي المشكلات colas‏ الأخرى التي تعتقد أن تواجهها الحكومات الفيدرالية وحكومات 
الولايات» والتي يمكن أن تستفيد من ذكاء الأعمال ومستودعات البيانات؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة الافتتاحية القصيرة؟ 

تُوضّح المقالة الافتتاحية قيمة ذكاء الأعمالء وأنظمة دعم القرارء ومستودعات البيانات في 
إدارة الإيرادات الحكومية. مع تنفيذ مستودع البيانات الخاصة بهم» تمكّنت ولاية ميريلاند 
من الاستفادة من أصول البيانات الخاصة بها؛ لاتخاذ قرارات أكثر دقة وفي الوقت المناسب 
حول تحديد الإقرارات الضريبية الاحتيالية. وبتنفيذهم لفكرة مستودع البيانات» S‏ ولاية 
ماريلاند من الاستفادة من أصول البيانات الخاصة بها بشأن اتخاذ قرارات أكثر دقة وفي الوقت 
المناسب؟ وذلك فيما يتعلق بتحديد الإقرارات الضريبية الاحتيالية. وقد أتاح g5‏ ومعالجة 
مجموعة واسعة من مصادر البيانات داخل مستودع بيانات موحد لولاية ماريلاندء تحديد 
إشارات/ قواعد/ سمات الاحتيال الضريبي من الحقائق التاريخية بصورة أو توماتيكية بدلا 
من الاعتماد فقط على الطرق التقليدية؛ إذ تمّ تطبيق قوا عد التصفية القائمة على الحدس. 
وباستخدام مستودعات البيانات وذكاء الأعمال, case‏ ولاية ماريلاند من تقليل مُعذَّل القيم 
الموجبة الخطأ بشكل ملحوظ (وبذلك تمّ تخفيف العبء الضريبي على الممولين) كما aS‏ 
من تحسين معدل دقة التنبؤ من 2٠١‏ إلى X36‏ (أي أكثر من ستة أضعاف التحسن في دقة 
تحديد الإقرارات الضريبية الاحتيالية). diis‏ الدرس الرئيس هنا هو أن مستودع البيانات 
piatt‏ والمنفذ بشكلٍ صحيح مع أدوات وتقنيات ذكاء الأعمال يمكن أن يؤدي إلى تحشّن 
معنوي (سواء على مستوى الدقة أو التوقيت)؛ مما يؤدي إلى فوائد (مالية أو غير مالية) لأيّ 
منظمة. ها في ذلك حكومات الولايات مثل ماريلاند. 
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۲-۳ ذكاء الأعمال ومستودعات البيانات: 

لقد كان ذكاءٌ الأعمالء كمصطلح لوَصْف عملية اتخاذ القرار الإداري القائم على 
الحقائق/ الدليلء موجودًا منذ أكثر من Lalo ٠١‏ ومع ظهور تحليلات الأعمال ككلمة Aj;‏ 
جديدة لوصف نفس الظاهرة الإدارية إلى X5‏ كبير؛ فقد انخفضت شعبية مصطلح ذكاء الأعمال. 
وعلى عكس كونه مصطلحاً شاملا يُستَخِدّم ذكاء الأعمال في الوقت الحاضر لوصف المراحل 
المبكرة لتحليلات الأعمال (أيْ: التحليلات الوصفية). 





esi‏ الشكل ٠-١‏ (والذي تم عَرْضِ وشَرْح نسخة äh iuh‏ منه في الفصل الأول لوصف 
تصنيف تحليلات الأعمال) العلاقة بين ذكاء الأعمال وتحليلات الأعمال من منظور مفاهيمي. وكما 
هو مُوضّح هنا؛ فإن ذكاء الأعمال هو جزءٌ Giog ghlas‏ من سلسلة تحليلات الأعمال؛ إذ يؤدي 
نضجها إلى تحليلات متقدمة - وهي Qu je‏ من التحليلات التنبؤية والإلزامية. 

i s‏ التحليلات الوصفية (أَيْ: ذكاء الأعمال) مستوّى مبدئيًا للدخول في تصنيف تحليل 
الأعمال. وغالبًا ما (alla?‏ عليها اسم إعداد تقارير النشاط التجاري؛ بسبب حقيقة أن معظم 
أنشطة التحليلات في هذا المستوى تتعامل مع إنشاء تقارير لتلخيص الأنشطة التجارية للإجابة 
عن أسئلةء مثل: «ماذا حدث؟» lorg‏ الذي يحدث؟». تشمل هذه الحزمة من التقارير لقطات 
ثابتة لمعاملات الأعمال التي تم تسليمها إلى العاملين في مجال المعرفة ssl)‏ صُناع القرار)؛ وذلك 
وفقًا لجدول زمني ثابت (يوميء» أو أسبوعيء أو ربع سنوي) وكذلك تقارير مُخصّصة osi‏ 
صانع القرار من إنشاء تقريره الخاص (باس تخدام واجهة مُستخدم رسومية حدسية مُسطحة) 
لمعالجة حالة قرار odas‏ أو فريدة من نوعها؛ وأيضًا وجهات نظر ديناميكية لمؤشرات أداء 
الأعمال الرئيسة (والتي غالبًا ما يتم التقاطها وعرضها في نظام إدارة أداء الأعمال) يتم تسليمها 
إلى المديرين والموظفين التنفيذيين في شكل سهل الاستيعاب (مثل: واجهات رسومية تظهر كلوحة 
معلومات) بطريقة مستمرة. 


Sources: Teradata case study. (2016). Targeting tax fraud with advanced analytics. http://assets.teradata. 
com/resourceCenter/downloads/CaseStudies/EB7183 GT16 CASE STUDY Teradata V.PDF (accessed 
June 2016); Temple-West, P. (2013, November 7). Tax refund ID theft is growing "epidemic": U.S. IRS 
watchdog. ^ Reuters. — http://www.reuters.com/article/us-usa-tax-refund-idUSBRE9A61HB20131107 
(accessed July 2016). 
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شكل :1-Y‏ العلاقة بين تحليلات الأعمالء وذكاء «Jis MI‏ وتخزين البيانات 

بشكلٍ عام؛ وكما هو oua‏ في الشكل )١-۲(‏ تعتمد أنظمة ذكاء الأعمال على مستودع البيانات 
كمصدر للمعلومات؛ من أجل إنشاء ودَّعُم القرارات الإدارية. إذ يتم التقاط العديد من البيانات 
التنظيمية والخارجية وتحويلها وتخزينها في مستودع بيانات لدعم القرارات الدقيقة في الوقت 
المناسب من خلال نظرة عميقة للأعمال. ويهدف هذا الفصل إلى تغطية المفاهيم والطرق 
والأدوات المتعَلّقة مستودعات البيانات وإدارة أداء الأعمال. 





ما هو مستودع البيانات؟ 

بعبارة بسيطة؛ 1 مستودع البيانات (DW)‏ تجمعاً من البيانات التي يتم إنتاجها لدعم 
عملية gio‏ القرار. وهو Ua‏ منطقةٌ ds‏ بالبيانات الحالية والتاريخية والتي من المحتمل أن 
تكون ذات أهمية كبيرة في المسقبل بالنسبة للمديرين في جميع أقسام المنظمة. oleg‏ ما تكون 
البيانات مهيكلة؛ بحيث تظهر في صيغة جاهزة لأنشطة امعالجة التحليلية (أي: المعالجة التحليلية 
عبر الإنترنت [OLAP]‏ التنقيب في البياناتء الاستعلام إعداد التقارير» وغيرها من تطبيقات دعم 
القرار). إن مستودع البيانات؛ هو عبارة عن مجموعة موضوعية ومتكاملة وموجهة زمنيًا وغير 
متطايرة من البيانات لدعم العملية الإدارية المتعلقة باتخاذ القرارات. 
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منظور تاريخي لمستودعات البيانات: 

على الرغم من أن مستودعات البيانات هو مصطلح جديد نسبيًا في تقنية المعلومات (IT)‏ 
فإنه من الممكن ai‏ أصوله التاريخية» وحتى من قبل التوشّع في استخدام أجهزة الحاسب. ففي 
أوائل القرن العشرين؛ كان الناس يستخدمون البيانات (بالطرق اليدوية) لصياغة الاتجاهات التي 
تساعد مستخدمي الأعمال في اتخاذ قرارات مستنيرة. وهو أكثر الأغراض السائدة في مستودعات 
البيانات. وترجع - تاريخيًا - الدوافع التي csl‏ إلى تطوير تقنيات مستودعات البيانات إلى حقبة 
السبعينيات» عندما هيمنت المركزية على ble‏ الحوسبة. وقد امتلكت تطبيقات معالجة البيانات 
التجارية الحقيقية - والتي يتم تشغيلها على أجهزة الحاسب المركزية للشركات - هياكل ملفات 
معقدة باستخدام الجيل المبكر من قواعد بيانات (وليست قواعد البيانات الجدولية المستخدمة 
في معظم التطبيقات في الوقت الحالي) والتي يتم إيداع البيانات بها. وعلى الرغم من أن هذه 
التطبيقات fhol cais‏ جيدًا في وظائف معالجة البيانات للمعاملات الروتينية؛ إن البيانات التي & 
إنتاجها من أداء هذه الوظائف (مثل: المعلومات المتعلقة بالعملاءء وا منتجات التي يطلبونهاء والأموال 
التي ينفقونها) قد تمّ دفنها بعيدًا في أعماق الملفات وقواعد البيانات. وعندما ظهرت الحاجة إلى 
معلومات مُجمّعة مثل: اتجاهات المبيعات بحسب المنطقة ونوع المنتج كان ينبغي أن تطلب رسمياً 
من قسم معالجة البيانات؛ إذ تم وَضع ذلك الطلب في قائمة انتظار تضم مئات من طلبات التقارير 
الأخرى )2009 es ;(Hanimergten & Simon,‏ الرغم من ظهور الحاجة إلى المعلومات والبيانات 























امُستخدّمة لتوليد تلك المعلومات؟ ob‏ تقنية قواعد البيانات لم تكن موجودة 6 لتحقيق ذلك. ويُوضُح 
الشكل Y-Y‏ جدولًا زمنيًا يظهر فيه بعض الأحداث المهمة التي OSÍ‏ إلى تطوير مستودعات البيانات. 
تحليلات البيانات الضخمة التخزين المركزي البيانات أجهزة الكمبيوتر الرئيسية 
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تحليلات النص والويب ر Inmon‏ وبناء مستودع البيائات Vo‏ إعداد التقارير الروتينية | 7 
Kimball 7 Hadoop. MapReduce, NOBOL‏ نجرا رف ودع يفت ي 34 هياكل قاعدة البيانات VAM‏ 
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شكل 8-؟: ägt‏ الأحداث التي 3l‏ إلى تطوير تخزين البيانات 
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في أواخر القرن الماضي؛ ظهرت شركات تجارية تعمل على تطوير الأجهزة والبرمجياتء وقد 
da‏ ظهور تلك الشركات بعض الحلول لهذه المشكلة. وقد انبثق بين عامي 19177 و15175م 
مفهوم شركة جديدة - تيراداتا - من الأبحاث في agza‏ كاليفورنيا للتقنية Bax aa (Caltech)‏ 
على مناقشات Co]‏ مع مجموعة التقنية المتقدّمة في .Citibank‏ وقد عمل المؤسسون على 
تصميم نظام لإدارة قواعد البيانات للمعالجة المتوازية مع المعالجات الدقيقة المتعددة» والتي 
تستهدف بشکل خاصٌ دعم القرار. W ds‏ يوليو G3 PIVA‏ تأسيسٌُ تيراداتا رسميًاه وقد بدأت في 
جراج Brentwood à‏ بولاية كاليفورنيا. وقد e‏ اختيار اسم تيراداتا لترمز إلى القدرة على إدارة 
تيرابايت (تريليونات من الحروف) من البيانات. 

كانت الثمانينيات هي عقد الحواسيب الشخصية والحواسيب الصغيرة. وقبل أن يعرفها 
b ael‏ تعد تطبيقات الحاسب الحقيقية موجودةً على أجهزة الحاسب المركزية فقط؛ بل كانت 
موجودةً في JS‏ مكانٍ يمكن أن تتواجد فيه (Sl‏ منظمة؛ مما تسبب في ظهور مُشكلة خطيرة تُسمّى 
جزر البيانات. وقد jo sôi‏ هذه المشكلة إلى نشأة نوع جديد من الرمجيات» يُسمّى نظام jo]‏ 
قاعدة البيانات امموزعةء والذي من شأنه سخب البيانات المطلوبة بطريقة سحرية من قواعد 
البيانات من جميع أقسام المنظمة. وإعادة جميع تلك البيانات s‏ أخرى إلى نفس المكان» ثم 
دمجهاء وفرزهاء وعمل كل ما يلزم للإجابة عن سؤال المستخدم. وعلى الرغم من كون المفهوم 
جيدًا وكذلك كون النتائج المبكرة من الأبحاث واعدة؛ فإنها كانت نتائج عادية وبسيطة؛ فهي م 
تعمل بكفاءة على أرض الواقع» وبالتالي ظلت مشكلة جزر البيانات قائمة. 

d‏ الوقت نفسه؛ بدأت Glo‏ في شَخذ JS‏ اهتماماتها تجاه المنتجات التجارية المتعلقة بحل 
هذه المشكلة. وقد حصل بنك ويلز فارجو على أول نظام اختبار تيراداتا في عام VAY‏ وهو أحد 
أنظمة إدارة قواعد البيانات العلائقية (RDBMS)‏ وهو RU‏ مواز لدعم القرار» Jas‏ الأول من 
نوعه في blo‏ وبحلول عام MAE‏ أصدرت تيراداتا نسخة من منتجهاء وفي عام VIAT‏ أطلقت 
مجلة Fortune‏ على تيراداتا لقب «منتج العام». وقد قام منتج تيراداتا - والذي لا يزال GEB‏ حتى 
اليوم - ببناء dol‏ جهاز طمستودعات البيانات» وهو عبارة عن مجموعة من الأجهزة والبرمجيات 
لتلبية احتياجات مستودعات البيانات للكثير من المتعاملين في هذا الحقل. وبدأت كذلك العديدٌ 
من الشركات الأخرى في صياغة إستراتيجياتها. 

كما وقعت عدة أحداث أخرى خلال الثمانينيات من القرن الماضي؛ مما أكسبها لقب حقبة 
الابتكار في مستودعات البيانات. فعلى سبيل المثال: أسّس رالف كيمبال أنظمة Red Brick‏ في 
عام eA‏ بدأت أنظمة Red Brick‏ في الظهور كشركة برمجيات رائدة من خلال مناقشة كيفية 
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تحسين الوصول إلى البيانات؛ ففي عام JS p e VAM‏ من باري ديفلين وبول مورفي من TBM‏ 
إيرلندا مصطلح مستودع بيانات الأعمال كمكوّن أساسي لنظم المعلومات التجارية. ds‏ تسعينيات 
القرن العشرين؛ طفت على السطح طريقة جديدة لحل مشكلة جزر البيانات. وإذا كانت طريقة 
الثمانينيات قد فشات ف الحصول على البيانات والوصول إليها مباشرةً من الملفات وقواعد 
البيانات؛ فقد انطوت فلس dà‏ التسعينيات على العودة إلى نهج السبعينيات؛ إذ تم RS‏ البيانات 
من تلك الأماكن إلى مكان آخرء ولكن يتم فل ذلك بشكلٍ أكثر دقة. ومن هنا DI‏ مستودعات 
البيانات. في عام fe VARY‏ كتب Bill Inmon‏ كتاب slo‏ مستودع البيانات. يُصنَّف الكثيرٌ من الناس 
كأب لمستودعات البيانات. وظهرت منشورات إضافية - ما في ذلك كتاب «مجموعة 
أدوات مستودع البيانات» لصاحبه رالف كيمبال 1997م - والتي ناقشت تقنيات تصميم الأبعاد 
ذات الأغراض العامة لتحسين بنية البيانات لأنظمة دعم القرار المرتكزة على الاستعلام. 

ومع بدايات الألفينات» وفي ble‏ مستودعات البيانات» استمرّت شعبية البيانات في النمو. 
los‏ اندماج مجتمع المورّدين مع الخيارات. وفي عام 7١٠٠٠م؛‏ استحوذت شركة مايكروسوفت 
(Microsoft)‏ على ProClarity‏ إذ قفزت إلى سوق مستودعات البيانات. وفي عام ۲۰۰۷م؛ 
قامت شركة أوراكل بشراء Hyperion‏ واستحوذت SAP‏ على Business Objects‏ واندمجت 
IBM‏ مع Cognos‏ لقد التهم قادة Sİ‏ 52552( حلول نظم المعلومات في العام قادة مستودعات 
البيانات في التسعينيات. وخلال هذه الفترة؛ ظهرت ابتكارات أخرىء ما في ذلك أجهزة مستودعات 
البيانات من loga‏ مثل Netezza‏ (التي استحوذت عليها GreenPlums (IBM‏ (التي دخلت 
في مظلة DATAllegros (EMC‏ (التي اندمجت مع مايكروسوفت «((Microsoft)‏ وأجهزة 
إدارة الأداء التي سهّلت عملية مراقبة الأداء بشكل فوري. وقد cos‏ هذه الحلول المبتكرة 
وفورات في التكاليف؛ لأنها كانت متوافقة في تكوينها مع الحلول القدهة لمستودع البيانات. 

منذ عام ١٠٠۲م؛‏ كانت الضجة الكبيرة هي البيانات الضخمة. يعتقد الكثيرون أن البيانات 
الضخمة ستؤثر في مستودعات البيانات. وحيال ذلك إما أنهم سيجدون طريقة للتعايش (والتي يبدو 
أنها الحالة الأكثر ترجيحًاء على الأقل لعدة سنوات) أو أن البيانات الضخمة (والتقنيات التي تصاحب 
وجودها) ستجعل التخزين التقليدي للبيانات أسلوبًا Mags GIS‏ وتتضمّن التقنيات التي جاءت 
مع البيانات الضخمة كلا من (Hives NoSQLs MapReduces Hadoop‏ وربما L‏ سنكون بصدد 
ظهور مصطلح جديد تتم صياغته في عام البيانات؛ ليجمع بين ظهور مصطلح جديد تمّ صياغته في عام 
البيانات الذي يجمع بين احتياجات وقدرات التخزين التقليدي للبيانات وظاهرة البيانات الضخمة. 
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خصائص مستودعات البيانات: 
Sad‏ أحد الطرق الشائعة لإدخال مستودعات البيانات؛ هو الرجوعٌ إلى الخصائص الأساسية 

لتلك البيانات والتي 3&5 من أهمّها (انظر: 2005 :(Inmon,‏ 

- التوجّه بالموضوع: يتم تنظيمٌ البيانات حسب تفاصيل الموضوع: مثل: المبيعات» أو المنتجات» 
أو العملاءء والتي تحتوي فقط على المعلومات المتعلّقة بدعم القرار. ولا OR‏ توجيه الموضوع 
المستخدمين من تحديد LAS‏ أداء أعمالهم فحسب؛ بل eae Ul‏ من معرفة سبب أدائهم 
لتلك المهام. ويختلف مس تودع البيانات عن قاعدة البيانات التشغيلية؛ بحيث يكون لمعظم 
قواعد البيانات التشغيلية digs‏ منتج. ويتمُ ضبطها للتعامل مع المعاملات التي تقوم بتحديث 
قاعدة البيانات. js)‏ اتجاه الموضوع Â b‏ أكثر شمولية للمنظمة. 

- التكامل: يرتبط التكامل ارتباطًا s‏ بتوجيه الموضوع. كما يجب على مستودعات البيانات 
أن توفر البيانات القادمة من مصادر مختلفة في شكل متسق. وللقيام بذلك؛ فيجب على 
مستخدمي تلك المستودعات التعامل مع تسمية التعارضات والتناقضات بين وحدات القياس. 
ومن المفترض أن يكون مستودع البيانات متكاملًا SU‏ 

- التغيّر مع الوقت (سلسلة زمنية): يحتفظ المستودع بالبيانات التاريخية. وليس بالضرورة أن 
توفر البيانات الحالة الحالية (باستثناء الأنظمة الفورية). فهي تكتشف الاتجاهات والانحرافات 
والعلاقات طويلة الأجل للتنبؤ والمقارنات؛ مما يؤدي إلى اتخاذ قرار. ويكون SJ‏ مستودع 
بيانات جودةٌ زمنية. ig‏ الوقت هو AEI‏ الأكثر أهميةً ورا الأوحد الذي يجب أن يتم 
دعمه من قبل جميع مستودعات البيانات. كما تحتوي البيانات اللُجهّزة للتحليل والقادمة 
من مصادر متعددة على نقاط زمنية مختلفة (كالمشاهدات اليومية» والأسبوعية: والشهرية). 

- عدم التطاير(الثبات): S‏ مستودعات البيانات في المستودع؛ GSE Y‏ للمستخدمين تغيير أو 
تحديث تلك البيانات؛ ]3 يتم تجاهل البيانات القديمة» ويتم تسجيل التغييرات كبيانات جديدة. 

هذه الخصائص السالفة الذكر تمكّن مستودعات البيانات Kad‏ ضبطها بشكل حَضْري تقريبًا 

ملهمة الوصول إلى البيانات. كما ABS‏ خصائص أخرى إضافية للبيانات والتي تتضمّن ما يلي: 

- الارتكاز على شبكة الإنترنت: يتم تصميمٌ مستودعات البيانات Šole‏ لتوفير بيئة حوسبة فعّالة 
للتطبيقات المستندة إلى الويب. 

- العلائقية/ متعددة الأبعاد: يستخدم مستودعٌ البيانات LA dco ÚJ‏ أو áo‏ متعددةٌ الأبعاد. 
ويمكن العثور على دراسة استقصائية حديثة حول الهياكل المتعددة الأبعاد في روميرو وأبيلو )5 Y^‏ 
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- خدمة العملاء: يَستخدمٌ مستودع البيانات GS‏ خدمة العملاء؛ لتوفير وصول سهل للمستخدمين النهائيين. 
- الفورية: توفّر مستودعات البيانات الأحدث إمكانيات الوصول إلى البيانات وتحليلها بشكل 
فوري أو نشط (انظر: 2004 -(Basu, 2003; Bonde & Kuckuk,‏ 1 
- الاشتمال على البيانات الوصفية: يحتوي مستودع البيانات على بيانات وصفية (بيانات عن 
البيانات) حول كيفية تنظيم البيانات وكيفية استخدامها بفعالية. 
في الوقت الذي A‏ فيه مستودعٌ البيانات مكاناً Cal‏ للبيانات» تُعَدُ مستودعات البيانات 
العملية برمتها حرفيًا (انظر: 2002 d$ | (Watson.‏ مستودعات البيانات نظامًا ينتج عنه 
تطبيقات توفر $98 على دعم القران كما يسمح بإمكانية الوصول إلى معلومات الأعمالء وأيضًا 
رؤية لتلك الأعمال. والأنواع الرئيسية الثلاثة لمخازن البيانات؛ هي: أسواق البيانات (DMs)‏ 
ومخازن البيانات التشغيلية (ODS)‏ ومستودعات بيانات المؤسسة (EDW)‏ وفيما يلي مناقشة 
لهذه الأنواع الثلاثة من المستودعات» ثم سنناقش Lf‏ بعد ذلك البيانات الوصفية. 


أسواق البيانات (DMs)‏ 


في الوقت الذي يضم فيه مستودع البيانات قواعدّ البيانات الكبيرة عبر المؤسسة بأكملهاء bole‏ 
ما يكون سوق البيانات (DM)‏ أصغر حجمًا ويركّز أكثر على موضوع أو قسم معين. إن DM‏ هو 
عبارة عن مجموعة فرعية من مستودع البيانات» تتكوّن Šole‏ من منطقة موضوع واحد فقط 
(كالتسويقء أو العمليات). وقد تكون xo DM‏ أو مستقلةً. يكون سوق البيانات التابع عبارة 
عن مجموعة فرعية يتم إنشاؤها مباشرةٌ من مستودع البيانات. كما أن لديها blja‏ استخدام نموذج 
بيانات متسق وتوفير بيانات جيدة. وتقوم أسواق البيانات التابعة pti,‏ مفهوم نموذج بيانات 
واحد على مستوى المؤسسة بأكملها؛ ولكن يجب tU) Sol‏ مستودع البيانات. يضمن DM‏ التابع 
للمستخدم النهاني أن يشاهد نفس الإصدار من البيانات التي يشاهدها كل المستخدمين الآخرين 
مستودع البيانات. تتسبّب التكلفة العالية لمستودعات البيانات في ]59 من استخدامها للشركات 
الكبيرة. فتستخدم العديدُ من الشركات بدلا من ذلك uuo]‏ منخفض التكلفة ومصغرًا لمستودع 
البيانات يُعرّف على أنه سوق البيانات المستقل. يعد سوق البيانات المستقل مستودعًا صغي؟ 
Kaaa‏ لوحدة أعمال إستراتيجية؛ لکن لا يكون مستودع بيانات المشروع (EDW)‏ مصدرًا له. 


مخازن البيانات التشغيلية (ODS)‏ 


is‏ مخزن البيانات التشغيلي (ODS)‏ نموذجًا bao‏ إلى A‏ ما ملف معلومات العميل. 
وغالبًا ما يُستخدّم هذا النوع من قواعد البيانات كمنطقة مؤقتة لمستودعات البيانات. وبخلاف 
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المحتويات الثابتة لمستودع البيانات» يتم تحديث محتويات (ODS)‏ طوال فترة العمليات 
التجارية. وتُستخدّم (ODS)‏ في اتخاذ القرارات القصيرة الأجل التي تشمل التطبيقات ذات المهامٌ 
الحسّاسة بدلا من اتخاذ القرارات المتوسطة والطويلة الأجل مرتبطة ب (EDW)‏ تشبه (ODS)‏ 
الذاكرة القصيرة المدى في أنها 0525 المعلومات الحديثة فقط. وف المقابل؛ يشبه مستودع البيانا 
الذاكرة الطويلة المدى؛ لأنه 0529 معلومات دائمة. يقوم edo ODS‏ البيانات القادمة من أنظمة 
مصادر مُتعدّدة ويوفر رؤية متكاملة تقريبًا للبيانات المتغيرة والحالية. وتتطابق عمليات تبادل 
ونقل وتنزيل (ETL)‏ - والتي ستتم مناقشتها لاحقًا في هذا الفصل - الخاصة ب (ODS)‏ مع 5 
العمليات المتعلقة مستودع البيانات. dolo‏ يتم إنشاء سوق التشغيل (انظر: 2001 Imhoff,‏ 
عند الحاجة إلى تحليل البيانات التشغيلية المتعددة الأبعاد. وتجدر الإشارة إلى أن مصدر البيانا 
الخاصة بسوق التشغيل هو نظام -ODS‏ 


C 


عام 





C 


مستودعات بيانات المؤسسة (EDW)‏ 

d)‏ مستودع بيانات المؤسسة (EDW)‏ مستودعً بيانات واسع النطاق piu‏ لدعم القرار 
في جميع أنحاء المؤسسة. $g‏ طبيعة (EDW)‏ الواسعة النطاق تكامل البيانات القادمة من 
العديد من المصادر في شكل قياميٌ لتطبيقات ذكاء الأعمال الفعّالة وتطبيقات e5‏ القرار. يتم 
استخدامٌ (EDWS)‏ لتوفير بيانات للعديد من أنواع أنظمة دعم القرار Le (DSS)‏ في ذلك إدارة 
علاقات العملاء (CRM)‏ وإدارة سلاسل التوريدات (SCM)‏ وإدارة أداء الأعمال 4BPM)‏ 
ومراقبة نشاط العمل وإدارة دورة حياة gahl‏ وإدارة الإيرادات وأحيانًا حتى أنظمة إدارة 
ا معرفة. وتوضّح Ilodi‏ العملية (VV)‏ مجموعةً egito‏ من المزايا التي تعود إيجابيًا على شركات 
الاتصالات من cho‏ تنفيذها لحلول تحليلات البيانات المخزّنة في المستودع. 


البيانات الوصفية: 

تُعرّف البيانات الوصفية بأنها بيانات تصف بيانات (على سبيل المشال: انظر 
(Sen, 2004: Zhao, 2005‏ وتقوم البيانات الوصفية بِوَصّف بنية البيانات وبعض معانيها؛ مما 
يُسهم في استخدامها JUI‏ أو غير الفعال. أشار ميهرا (0١٠٠م)‏ إلى أن عدداً قليلاً من المنظمات 
ehis‏ بالفعل طبيعة البيانات الوصفية» ويتفهم Sae‏ أقل من الأول لكيفية تصميم وتنفيذ 
إستراتيجية للبيانات الوصفية. gag‏ تعريف البيانات الوصفية بشكل fele‏ من حيث الاستخدام 
كبيانات وصفية تقنية أو بيانات أعمال. Ass‏ الأماط ia b‏ أخرى لعرض البيانات الوصفية؛ إذ 
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da البيانات التي‎ sel) من البيانات الوصفية النحوية‎ JS من منظور نمطي أن تُفرّق بين‎ Lus 
البيانات التي تَصف بنية البيانات) والبيانات‎ sil) بناء جملة البيانات) والبيانات الوصفية الهيكلية‎ 
البيانات التي تصف معنى البيانات في مجال معين).‎ ssl) الوصفية ذات الدلالات اللفظية‎ 


حالة عملية ١-۳‏ 
خطة بيانات أفضل: تستفيد شركات الاتصالات الجيدة التأسيس من مستودعات 
البيانات والتحليلات؛ للبقاء على القمة في صناعة تنافسية 

جَنَت ÈE À‏ الاتصالات - التي ساعدت على تحفيز النمو الهائل لهذه الصناعة في 
أواسط وأواخر تسعينات القرن الماضي- منذ فترة طويلة فوائد أن تكون أول سوق xl)‏ 
الريادة في هذا الحقل). ولكن للحفاظ على القدرة التنافسية؛ يجب على هذه الشركات 
تحسين JS‏ شيء باستمرار بدءًا من خدمة العملاء إلى تخطيط الأسعار. وفي الواقع؛ تواجه 
شركات الاتصالات الجوالة المخضرمة adsl]‏ من نفس التحَدَّيات التي تواجهها الشركات 
الصاعدة. مثل: الاحتفاظ بالعملاءء وخفض التكاليف» وتحسين نماذج التسعير, ورّفع مستوى 
La;‏ العملاءء واكتساب عملاء جُددء phig‏ دور وسائل الإعلام الاجتماعية في ولاء العملاء. 

Cas‏ تحليلاتٌ البيانات العالية الاستهداف دورًا أكثر أهميةٌ في مساعدة شركات 
الاتصالات الجوالة على تأمين أو تحسين مكانتها في سوق تتزايد فيه المنافسة. وفيما يلي: 
كيف يعمل بعض go JUS‏ الخدمات في العام على إنشاء مستقبل قوي قائم على 
الأعمال التجارية القوية وذكاء العملاء. 

المحافظة على العملاء: 


قد لا يخفى على أحد أن السرعة والنجاح اللذين يتعامل بهما eA‏ الخدمة مع 
طلبات الخدمة يؤثران بشكل مباشر على مستوى رضا العملاءء وبالتالي ا ميل إلى التسرب. 
لكن التحَدّي هنا هو الوصول إلى العوامل التي لها أكبر الأثر. 

تدوّن روكسان جارسيا - مديرة مركز العمليات التجارية لشركة 
Telefónica de Argentina‏ - في ملاحظاتها: «إذا US‏ من تتبّع الخطوات المتبعة مع 
JS‏ عملية؛ فيمكننا أن نفهم نقاط الفشل والتسارع. كما يمكننا قياس تدفقات العمل 
داخل الوظائف وفيما بينهاء والتنبق بمؤشرات الأداء بدلا من الاستجابة لهاء ورفع مستوى 
الرضا العام عن تشغيل عملاء جدد». 
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كان حل الشركة؛ هو مشروع التتبّع الذي بدأب ٠١‏ لوحات معلومات في عام 
۹ م. ومنذ ذلك الحين؛ coli‏ الشركة عائدات سنوية قدرها 6,! مليون دولار 
أمريكي ووفورات في التكاليف. وتقليص وقت اكتساب العملاء الجدد. وانخفاض في عدد 


تسرب العملاء بنسبة I‏ 

تقليل التكاليف: 

يعتمد البقاءٌ على القمة في (Sl‏ صناعة, في sjo‏ كبير منهء على الحفاظ على التكاليف 
في dol‏ مستوياتها. بالنسبة لشركة Bouygues Telecom‏ الفرنسية. تمّ خَفْضُ التكلفة 
بصورة آلية. يقوم Aladin‏ - وهو نظام إدارة عمليات التسويق القائم على شركة 
تيراداتا - بنقل عمليات الإنتاج التسويقية المباشرة إلى الصورة الآلية. وقد chis‏ 
مدخراتها في عام واحدٍ أكثر من مليون دولار؛ في حين تضاعفت تكاليف حملة البريد 
لإلكتروني الخاصة بها وإنتاج المحتوى ثلاثة أضعاف. 

تقول كاثرين كورادو - مديرة المشروع الرائدة في مجال المبيعات ومديرة اتصالات 
التجزئة: ól»‏ هدفنا هو أن تكون أكثر idera]‏ واستجابةٌ لتبسيط العمل الجماعي» 
ولتوحيد وحماية خبراتناء يجعل نظام Aladin‏ أعضاء الفريق يركّزون أكثر على القيمة 
المضافة للعمل؛ من خلال تقليل ell‏ ذات القيمة امنخفضة؛ فتكون النتيجة النهائية 
المزيد من الجودة والإبداع في المخرجات». 

هناك فائدة غير مقصودة من Aladin‏ ولكنها (LÀ Js‏ بها للغايةء وهي أنه تم إلهامُ 
الإدارات الأخرى بِبَدْء تَر مشاريع مماثلة US)‏ شيء بدءًا من دعم مركز الاتصال وانتهاءً 
بعمليات إطلاق المنتجات/ العروض الترويجية. 





اكتساب العملاء: 

مع اختراق السوق بنسبة *٠٠١‏ أو أكثر في العديد من الدولء وبفضل المستهلكين 
الذين يمتلكون أجهزةً متعددة؛ SIS‏ مسألة كَمْبٍ عملاء جُدُد لا مل تحدياً صغيراً. كما 
تواجه شركة Mobilink‏ - أكبر شركة نقل في باكستان - صعوبة التشغيل في سوق تلك 
فيه ZIA‏ من ا مستخدمين dla‏ مسبقة gòl‏ والتي ydh‏ مشتريات منتظمة من 
الدقائق الإضافية. 

يقول pas‏ أفضال - كبير المديرين في بي ol» ssl‏ رفع القيمة» على وجه الخصوص» 
يحافظ على قوة وحساسية دور الإيرادات في Sé‏ شركتنا؛ ففي السابق ÉS‏ نفتقرٌ إلى 
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القدرة على تعزيز هذا الجانب من Sal‏ التدريجي. لقد منحنا نموذجنا لمعلومات 
المبيعات تلك القدرة؛ لأنها ساعدت فريق المبيعات على رشم خطط المبيعات Al‏ 
على الإستراتيجيات الأكثر FSS‏ والمستندة على البيانات والتي تساعدنا على تزويد مُورّدِينا 
ببطاقات ال SIM‏ وكروت الخدش وقدرات زيادة الرّصيد الإلكتروني بشكلٍ كامل». 
irus‏ لذلك؛ $ 453( Mobilink‏ زيادةً في عدد المشتركين بنسبة ZY‏ فحسب؟ بل 
زادت أيضًا من اكتساب Mas‏ جدد بنسبة XE‏ وتحسين ربحية تلك المبيعات بنسبة JE‏ 


شبكات التواصل الاجتماعي: 


يعمل التوسّع في استخدام شبكات التواصل الاجتماعي على تغيير عدد المنظمات 
التي تتعامل مع S‏ شيء بد١‏ من خدمة العملاء مرورًا بالمبيعات وانتهاءً بالتسويق. 
ويتجه المزيدٌ من شركات الاتصالات إلى تحويل اهتمامها بالشبكات الاجتماعية؛ لفهم 
سلوك العملاء والتأثير فيه بشكلٍ أفضل. 

وقد بادرت els Mobilink‏ مشروع لتحليل الشبكات الاجتماعيةء والذي سوف 
يمن الشركة من استكشاف مفهوم التسويق الفيروسي وتحديد المؤثرين الرئيسين الذين 
يمكنهم العمل كسفراء علامة تجارية gad‏ المنتجات. وتبحث Velcom‏ عن مؤثرين 
رئيسين مشابهين إضافةً إلى عملاء منخفضي القيمة؛ إذ يكن الاستفادة من قيمتهم 
الاجتماعية لتحسين العلاقات القائمة. وفي نفس الوقت؛ تتطلّع Swisscom‏ إلى دمج 
جانب الشبكة الاجتماعية لسلوك العملاء مع بقية تحليلها خلال الأشهر القليلة القادمة. 

الارتفاع إلى مستوى التحَدّي: 

على الرغم من أن JS‏ سوق piä‏ تحَدّيات $258 خاصة به؛ OP‏ معظم شركات 
الاتصالات الجؤالة تنفق الكثير من الوقت والموارد في إنشاء pióg‏ وتنسيق الخطط 
لمواجهة (S‏ من التحَدّيات المُوضّحة هنا. والخبر السار هو أنه مع اتساع وتطور الصناعة 
وتقنية الهاتف المحمول على 55 السنين؛ ÓL‏ حلول تحليلات البيانات التي 3& إنشاؤها 
ممواجهة هذه التحَدّيات تُعَدُ $28 على تلك المواجهة. 

يقوم İos‏ البيانات الصوتية باستخدام العملاء الحاليين» والأعمال التجارية, 
ومعلومات السوق للتنبؤ والتأثير على السلوكيات والنتائج المستقبلية. وتكون النتيجة 
النهائية؛ هي الوقوف على e$‏ أكثر ES‏ وأكثر Áli‏ وأكثر نجاحًا للحصول على حصة 
سوقية وتحسين الرّبحية. 


vm‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


أسئلة للمناقشة: 

-١‏ ما هي التحَدّيات الرئيسية لشركات الاتصالات؟ 

-Y‏ كيف Sd‏ لمستودعات البيانات وتحليلات البيانات مساعدة شركات الاتصالات 
في cla‏ على تحَدّياتها؟ 

-Y‏ اذا تعتقد أن شركات الاتصالات مناسبة LE‏ للاستفادة الكاملة من تحليلات البيانات؟ 
Source: Marble, C. (2013). A better data plan: Well-established TELCOSs leverage‏ 


analytics to stay on top in a competitive industry. Teradata Magazine. http://www. 


teradatamagazine.com/v13n0/Features/ A-Better-Data-Plan (accessed June 2016). 


أسئلة مراجعة على القسم Y-Y‏ 

-١‏ ما هو مستودع البيانات؟ 

-Y‏ كيف يختلف مستودع البيانات عن قاعدة بيانات المعاملات؟ 
-Y‏ ما هو SODS‏ 

£- اذكر أوجه الاختلاف بين JS‏ من .EDWs ODS3 DM‏ 


1- ما هي البيانات الوصفية؟ اشرح أهمية البيانات الوصفية. 


Y-Y‏ عملية مستودعات البيانات: 


تقوم المؤسساتٌ - العامة والخاصة - ziku‏ البيانات والمعلومات وا معرفة باستمرار معدل 
متزايد السرعة وتخزينها في أنظمة محوسبة. وهنا يصبح الحفاظ على هذه البيانات والمعلومات 
واستخدامها أمرًا معقدًا للغاية؛ dao‏ مع ظهور مشكلات التوسّع. إضافةً إلى EUS‏ يستمرٌ تزايد 
عدد المستخدمين الذين يحتاجون إلى الوصول إلى اللعلومات نتيجة لارتفاع مستوى المصداقية 
وسهولة الوصول إلى الشبكةء وخاصة الإنترنت. لقد أصبح العمل مع قواعد بيانات متعددة 
- سواء ذات مستودع بيانات متكامل el‏ لا - مهمة بالغة الصعوبة تتطلّب خبرةً ŽS‏ ولكنها 
يمكن أن توفر فوائد هائلة تنجاوز تكلفتها بكثير. وكمثال توضيحيء يعرض الشكل ۲-۳ فوائد 
الأعمال التجارية لمستودع بيانات المؤسسة (EDW)‏ التي قامت تيراداتا ببنائه لصالح شركة 
تصنيع سيارات رائدة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vy‏ 


الفصل الثالث 





مستودع البيانات 
إدارة وأحدة iai y‏ 


ias 
اتكوين المنتج والضمان وبيائفت القراءة‎ 
الشخصية‎ 



































مارو تصين تكلفة الجودة مصاريف شمان مام إنتاجه] | مصروف مخقض للبنية 
i Eee‏ . | |تحديد اسرع ووضع لولويات | | تحسين دقة السداد من خلال التحتية. 

Becerra‏ دقة تقارير الأداء البيني وقرارات بشأن قضايا اتحسين جود بیقات 3ا2 خفض التكلفة من خلال 

del,‏ تتارير POI‏ الجودة المطالبات دمج سوق البيانات 





























Source: Tradata Corp 
اتخاذ القرارات المعتمدة على البيانات - فوائد الأعمال لمستودع البيانات‎ P-P شكل‎ 
مخازن بيانات ضخمة‎ sel العديدٌ من المنظمات إلى إنشاء مستودعات البيانات»‎ eL zoo 
لبيانات السّلاسل الزمنية المتعلّقة بدَعْم القرار. يتم استيرادٌ البيانات من مختلف الموارد الخارجية‎ 
تطهيرها وتنظيمها بطريقة تتوافق مع احتياجات المؤسسة. وبعد مَلء البيانات‎ eig والداخلية»‎ 
لمنطقة ما أو قسم معين. وبدلًا من‎ (DMS) في مستودع البيانات؛ يمكن تنزيل أسواق البيانات‎ 
لا يتم‎ Uli ومع ذلك؛‎ EDW وفقًا للحاجة - ومن ثم دَمْجُها في‎ - Sg? DM ذلك؛ يمكن إنشاء‎ 
وإنما يتم تنزيل البيانات ببساطة على أجهزة الحاسب الشخصية أو تركها في حالتها‎ DMs تطوير‎ 
باستخدام أدوات ذكاء الأعمال.‎ påla الأصلية؛ من أجل معالجة بارعة‎ 
نعرض في الشكل 4-8 مفهوم مستودع البيانات. وفيما يلي المكوّنات الرئيسية لعملية مستودعات‎ 
البيانات:‎ 
مصادر البيانات: يتم الحصول على البيانات من عدَّة أنظمة تشغيلية مس تقلة «قدهة» وربما‎ - 
البيانات أيضًا من‎ b من 3535( البيانات الخارجيين (مثل: التعداد السكاني الأمريكي). وقد‎ 
بيانات الويب في شكل‎ Lil siis وقد‎ (ERP) أو نظام تخطيط موارد المؤسسات‎ (OLTP) 
سجلات ويب من مستودع البيانات.‎ 
التنقيب في البيانات وتحويلها: يتم التنقيبُ في البيانات وتحويلها بشكل صحيح باستخدام‎ - 
1 ETL تجاريًا لهذا الغرض ويُسمَّى‎ Aaa أو‎ Lasas برنامج مكتوب‎ 
تنزيل البيانات: يتم تنزيل البيانات في منطقة تدريجية؛ إذ يتم تحويلها وتطهيرها. تكون‎ - 
DMs للتنزيل في مستودع البيانات أو في‎ jolo البيانات بعد ذلك‎ 


YA‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


- قاعدة بيانات شاملة: dd‏ بش (gel ad Js‏ هي (EDW)‏ لدعم تحليل القرار بصورة شاملة؛ 
من خلال توفير معلومات ذات dla‏ موجزة ومُفْصّلة قادمة من العديد من jalabi‏ المختلفة. 
- البيانات الوصفية: يتم الاحتفاظ بالبيانات الوصفية بالصورة التي n ad‏ بتقييمها من قبل 
موظفي ومُستخدمي التقنية. وتتضمّن البيانات الوصفية برامج عن البيانات والقواعد المتعلقة 
بتنظيم ملخصات البيانات التي aad‏ فهرستها والبحث فيها؛ خاصةً مع أدوات الويب. 
- الأدوات الوسيطة: تتيحٌ الأدوات الوسيطة الوصول إلى مستودع البيانات. ويمكن للمستخدمين 
المحترفين - كاءلحللين مثا - كتابة استعلامات SQL‏ الخاصة بهم. هكن للآخرين توظيف بيئة 
استعلام يتم إدارتها بصورة جيدة» Jia‏ كائنات الأعمال؛ وذلك بغرض الوصول إلى البيانات. 
هناك العديدٌ من التطبيقات ذات الواجهات الأمامية التي مُكن لأصحاب الأعمال التفاعل من 
خلالها مع البيانات المخرّنة في مستودعات Le OLLI‏ في ذلك التنقيب في البيانات» OLAP‏ 
أدوات alas]‏ التقاريرء وأدوات عرض البيانات. 
تطبيقات (تصوير) لا خيارات لسوق البيانات 


إعداد تقارير 
الأعمال 


الروتينية > 
oq‏ 7 
z‏ 
فى البيانات!النصمج 
E S‏ 
IN OLAP‏ 
لوحة المعلومات 
الويب 
H‏ 
تطبيقات 
مخصصة 


شكل :t-Y‏ إطار عمل وطرق عرض مستودع بيانات 
أستلة مراجعة على القسم Y-Y‏ 
-١‏ صف عملية مستودعات البيانات. 
-Y‏ صف المكوّنات الرئيسية لمستودع البيانات. 
a -Y‏ وناقش دور الأدوات الوسيطة. 
















































































ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 


الفصل الثالث 


€-Y‏ بنيات مستودعات البيانات: 

tele استخدامٌ العديد من فنيات نظام المعلومات الأساسية لمستودعات البيانات. وبشكل‎ GSE 
la jS] هذه الفنيات العميل/ الخادم أو البنية ذات عدد (ن) الطبقات» والتي تكون‎ GÀ u$ ما‎ Bale 
iab و1-8)؛ ولكن في بعض الأحيان يكون هناك‎ 0-Y شيوعًا ثنائية أو ثلاثية الطبقات (انظر الشكلين‎ 
هذه الأنواع من البنيات المتعددة الطبقات قادرةٌ على تلبية احتياجات‎ Sf واحدةٌ فقط. ومن المعروف‎ 
أنظمة المعلومات الواسعة النطاقء والتى تتطلب الأداءء مثل: مستودعات البيانات. وبالإشارة إلى‎ 
استخدام الفنيات المتعددة الطبقات المتداولة في مجال مستودعات البیانات؛ فان هوفرء وبريسكوت»‎ 
ومكفادين (۲۰۰۷) فرّقوا بين هذه الفنيات من خلال تقسيم مستودع البيانات إلى ثلاثة أجزاء:‎ 
مستودع البيانات نفسه: والذي يحتوي على البيانات والبرامج المرتبطة به.‎ -١ 
برنامج الحصول على البيانات (النهاية الخلفية): والذي يستخرج البيانات من الأنظمة القدهة‎ -Y 
وتلخيصها وتنزيلها في مستودع البيانات.‎ lado وا مصادر الخارجية» ومن ثم يقوم‎ 
برنامج العميل (الواجهة الأمامية): والذي يسمح لجميع المستخدمين بالوصول إلى البيانات‎ -۴ 
.(a DSS/bi/business analytics [BA] engine) وتحليلها من المستودع‎ 
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شكل :0-Y‏ بنية مستودع البيانات ثلاثية الطبقات 
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خادم التطبيق وقاعدة البيانات مكان عمل العميل‎ 





شكل T-P‏ بنية مستودع البيانات ثنائية الطبقات 


vé.‏ ذكاء الأعمال والتحليلات وعلم «LI‏ منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


في بنية ثلاثية الطبقات؛ تحتوي الأنظمة التش غيلية على البيانات والبرمجيات؛ لحَضْر البيانات 
في طبقة واحدة xs‏ الخادم)ء ويكون مستودعٌ البيانات à‏ طبقة أخرى» في حين تحتوي الطبقة 
الثالثة على محرك DSS/BUBA‏ (أيْ: خادم التطبيق) والعميل (انظر: شكل .(0-Y‏ تتم معالجة 
البيانات من المستودع مرتينء ويتمّ إيداعها في قاعدة بيانات إضافية ومُتعدّدة الأبعاد. تمّ تنظيمها 
لسهولة عمل تحليل وَعَرْضٍ مُتعدّد الأبعادء أو نسخها في -DMs‏ وتتمثل özi‏ البنية الثلاثية في 
فصلها عن وظائف مستودع البيانات؛ مما يلغي قيود الموارد ويُسِهّل إنشاء DM‏ 

ds‏ بُنية من مستويين» يعمل محرك DSS‏ فعليًا على نفس النظام الأساسي كمستودع للبيانات 
(انظر: شكل 7-7). ولذلك؛ فهي أكثر اقتصادًا من الهيكل الثلائي. ويمكن أن يكون للبنية ذات المستويين 
مشكلات في الأداء _لمستودعات البيانات الكبيرة التي تعمل مع التطبيقات الكثيفة OLUJI‏ لدعم القرار. 

يفترض جزءٌ كبيرٌ من الحكمة الشائعة اتباع a‏ استبداديء haso‏ أن أحد الحلول أفضل من 
الآخرء بصرف النظر عن ظروف المنظمة واحتياجاتها الفريدة. ولمزيدٍ من تعقيد هذه القرارات 
الهيكلية؛ 55 العديد من الاستشاريين ومُطوّرِي البرامج على eje‏ واحد من البنية؛ مما dad‏ من 
قدرتهم ودافعيتهم على مساعدة المنظمة من خلال الخيارات القائمة على احتياجاتها. ولكن يتم 
التشكيك في هذه الجوانب وتحليلها. فعلى سبيل المثال: قدَّم )2005( Ball‏ معايير اتخاذ القرار 
للمؤسسات التي تخطط لتنفيذ تطبيق ذكاء الأعمال وقد حدّد بالفعل حاجته إلى DMs‏ المتعددة 
الأبعاد؛ ولكنه يحتاج إلى المساعدة في تحديد البنية المتدرجة المناسبة. وتدور معاييره حول التنبؤ 
بالاحتياجات للمساحة وسرعة الوصول (للمزيد من التفاصيل انظر: 2005 .(Ball‏ 


Ago حلولا‎ eis من مستودعات البيانات والإنترنت من التقنيات الرئيسة التي‎ dS i 
عن دمج هاتين التقنيتين مستودعات البيانات على شبكة الإنترنت.‎ quus لإدارة بيانات الشركة.‎ 
هيكل مستودعات البيانات على الويب. إذ تتكون البنية من ثلاث‎ (V-Y) ونعرض في الشكل‎ 
طبقات» وتضمٌ عميل الحاسب وخادم الويب وخادم التطبيقات. على جانب العميل؛ يحتاج‎ 
من خلال واجهة المستخدم‎ (Java أن يكون‎ LÉA) المستخدم إلى اتصال إنترنت ومتصفح ويب‎ 
وسيط الاتصال بين العميل والخوادم هو الإنترنت/ الإنترانت/‎ isis GUI) الرسومية اللألوفة‎ 
۾ استخدامٌ خادم ويب لإدارة تدفق المعلومات الداخلة والخارجة‎ ET الإكسترانت. بالنسبة للخادم؛‎ 

بين العميل والخادم. وتكون مدعومةً من قبل Js‏ من مستودع البيانات وخادم التطبيقات. 
كما يوفر مستودعات البيانات على شبكة الإنترنت العديد من المزايا الجدّابةء Ue‏ في ذلك سهولة 
الوصول واستقلالية النظام وقلة التكلفة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ver‏ 


الفصل الثالث 


وتتشابه فنيات الويب الخاصة بمستودعات البيانات مع الفنيات الأخرى بمستودعات البيانات» 
والتي تتطلّب اختيار تصميم لإسكان مستودع بيانات الويب مع خادم المعاملات أو كخادم 
منفصل/ خوادم منفصلة. diis‏ سرعة تنزيل الصفحات أحد الاعتبارات Aa‏ في تصميم 
التطبيقات المستندة إلى الويب؛ ~ يجب تخطيط سعة الخادم بعناية. 
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شكل ۷-۳: بنية تخزين البيانات القائمة على الويب 


يجبٌ الوضع في الاعتبار العديدَ من المسائل عند تحديد Gİ‏ بنية سوف يتم استخدامها. من بينها ما sa‏ 


- ما هو نظام إدارة قواعد البيانات (DBMS)‏ الذي ينبغي استخدامه؟ يتم إنشاء معظم 
مستودعات البيانات باستخدام js kt -RDBMS‏ من 0:16 من شركة أوراكل oracle.)‏ 


SQL Servers (com‏ من شركة مايكروسوفت «(microsoft.com/sql)‏ و1082 من شركة 
IBM (http//www-0Libm.com/software/data/db2)‏ هم الأكثر استخدامًا. يدعم ds‏ 
من هذه المنتجات كلا من العميل/ الخادم والهياكل المبنية على شبكة الإنترنت. 


5 


iiu‏ المعالجة على التوازي el‏ على التوالي؟ o SE‏ اللعالجة المتوازية العديد من وحدات 
المعالجة المركزية (CPU)‏ من معالجة طلبات استعلام مستودع البيانات GF‏ كما توفر القابلية 
ggal‏ كلما لزم الأمر. يحتاج مُصمّمو مستودع البيانات إلى تقرير ما إذا كان سيتمٌ تقسيم 
جداول قاعدة البيانات ssl)‏ تقسيمها إلى جداول أصغر)؛ من أجل كفاءة الوصول» وتحديد 
المعايير التي ست eX‏ في المعالجة. وهذا هو الاعتبار eal‏ الذي تقتضيه كميات كبيرة من 
البيانات الواردة في مستودع بيانات نموذجي. هكن العثور على qula‏ حديث على مستودعات 
البيانات المتوازية والموزّعة في )2009( .Furtado‏ لقد نجحت شركة تيراداتا (Teradata.com)‏ 
في Lia‏ هذا النهج بكفاءةء وكثيرا ما يتم التوصية به. 


ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


- هل 


ver 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


- هل سيت استخدامٌ أدوات ترحيل البيانات لتنزيل مستودع البيانات؟ إن نقل البيانات من نظام 
قائم إلى مستودع للبيانات؛ هو aga‏ شاقةٌ ومُضنيةٌ. واعتمادًا على E33‏ وموقع أصول البيانات؛ 
قد تكون الهجرة إجراءً بسيطًا نسبيًا أو (على النقيض) مشروعًا يس تغرق عدة أشهر. يجب 
استخدامٌ نتائج تقييم شامل لأصول البيانات ال موجودة لتحديد ما إذا كان سيتمٌ استخدامٌ أدوات 
الترحيل el‏ لاء وإذا كانت الإجابة بنعم؛ فما هي القدرات المطلوبة في تلك الأدوات التجارية. 

- ما الأدوات التي سيتمٌ استخدامها لدعم استرجاع البيانات وتحليلها؟ في S‏ من الأحيانء يكون 
من الضروري استخدام أدوات مُتخصّصة لتحديد مواقع البيانات الضرورية والوصول إليها 
وتحليلها واستخراجها وتحويلها وتنزيلها بشكل دوري في مستودع البيانات؛ إذ يجب اتخاذ قرار 
بشأن اختيار أحد البدائل: lal -١‏ تطوير أدوات الترحيل alea‏ أو -Y‏ شراؤها من جهة خارجية 
أو -Y‏ استخدام الأدوات المتوفرة بنظام مستودع البيانات. وتستدعي عمليات الترحيل الفورية 
والمعقدة للغاية الاستعانة بأدوات ETL‏ لجهات خارجية مُتخصّصة. 


بُنيات مستودعات البيانات البديلة: 
على أعلى مستوى؛ يمكن تصنيف وجهات نظر تصميم هيكل مستودع البيانات في تصميم 

مستودع البيانات على مستوى المؤسسة (EDW)‏ وتصميم )2009 -DM (Golfarelli & Rizzi,‏ 

ونعرض في الشكل a-e (A-Y)‏ بعص البدائل لأنواع التصاميم الهيكلية الأساسية التي لا تكون 

(EDW)‏ خالصةً ولا DM‏ خالصةء ولكن تتنوع بين الهياكل الفنية التقليدية أو خارجها. وتشمل 
الهياكل الجديدة البارزة كلا من hub-and-spoke‏ والهياكل المموحّدة. تم اقتراح الهياكل الخمسة 
ax‏ في الشكل a-e (A-Y)‏ بواسطة -Watson (2005, 20062,b) 5 Ariyachandra‏ وني دراسة 
سابقة مستفيضة, 235 QS‏ من Sinha (2005)5 Sen‏ خمس عشرة منهجية مختلفة لمستودعات 
البيانات. تُصنّف مصادر هذه المنهجيات إلى ثلاث فئات عريضة: باعة التقنية الأساسية» وبائعي 

البنية التحتية. وشركات نمذحة المعلومات. 

-AAISS هذا هو أبسط البدائل الهيكلية وأقلها‎ Ol القول:‎ GLE سجلات البيانات المستقلة:‎ -I 
بعضها عن بعض لتلبية احتياجات الوحدات التنظيمية‎ ilizua Jaxl DMs وقد 3& تطويرٌ‎ 
المنفردة. وبسبب استقلاليتهاء قد يكون لها تعريفات بيانات غير مُتسقة وأبعاد ومقاييس‎ 
من الصعبء إن لم يكن‎ dl xs) DMs مختلفة؛ مما يؤدي إلى صعوبة تحليل البيانات عبر‎ 
الحصول على «نسخة واحدة من الحقيقة»).‎ mad! من‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ver‏ 


الفصل الثالث 


هيكل حافلة سوق البيانات: Ae)‏ هذا الهيكل بديلًا قابا للتطبيق ل DMs‏ المستقلة؛ إذ يتم 
رَبْط الأسواق المنفردة بعضها مع بعض عن طريق نوع من الوسائط. ونظرًا لأن البيانات تكون 
مرتبطة بعضها ببعض؛ فهناك فرصةٌ أفضل للحفاظ على اتساق البيانات في جميع أنحاء المؤسسة 
(على الأقل عند مستوى البيانات الوصفية). وعلى الرغم من أن هذا الهيكل يسمح باستعلامات 
البيانات المعقدة عبر [DMs‏ فإنَّ أداء هذه الأنواع من التحليل قد لا يكون بمستوى مُرضٍ. 


ةا 


ج- هيكل Jog hub-and-spoke‏ هذا هو أشهرٌ هيكل لمستودعات البيانات اليوم. وهنا 


Euan‏ الاهتمام على cly‏ بنية تحتية قابلة للتطوير وقابلة للصيانة (غالبًا ما يتم تطويرها 
بطريقة تكرارية» xol‏ موضوع تلو الآخر) والتي تتضمّن مستودع بيانات مركزي والعديد من 
JSI) DMs‏ وحدة تنظيمية). تسمح هذه البنية بسهولة التخصيص لواجهات المستخدم 
والتقارير. وعلى الجانب السَّلبِي؛ تفتقر هذه البنية إلى الرؤية الشاملة للمؤسسة وقد تقود 
إلى تكرار البيانات» ووقت استجابة طويل للبيانات. 


د- مستودع البيانات المركزي: يتشابه هیکل مستودع البيانات المركزي مع هيكل hub-and-spoke‏ 


باستثناء أنه لا تُوجَد DMs‏ تابعة؛ ويُوجَّد بدلًا منها EDW‏ عملاقًا يلبّي احتياجات جميع 
الوحدات التنظيمية. يوفّر هذا quail‏ المركزي للمستخدمين إمكانية الوصول إلى جميع 
البيانات الموجودة في مستودع البيانات بدلا من حصرها في DMs‏ وإضافةً إلى ذلك؛ فإنه 
يقلّل من كمية البيانات التي يتعيّن على الفريق الفني نقلها أو تغييرهاء وبالتالي تبسيط إدارة 
البيانات وقيادتها Giò‏ وإذا تمّ تصميمه وتنفيذه بشكلٍ صحيح؛ فإن هذا الهيكل يوفر رؤيةٌ 
das‏ في الوقت المناسب عن المشروع GY‏ شخص في cis Gi‏ أينما كان داخل المنظمة. 


ه- مستودع البيانات الموحّد: ail AS‏ الموحّد مثابة امتياز للقوى الطبيعية التي تفجّر أفضل 


الخطط لتطوير نظام مثالي. ويستخدم جميع الوسائل الممكنة لدمج الموارد التحليلية 
القادمة من مصادر مُتعدّدة لمقابلة الاحتياجات المتغيرة أو ظروف العمل. وبصورة أساسية؛ 
ينطوي النهج الموحّد على ذَمْج أنظمة متباينة. وفي البنية الموحدة؛ يتم ترك هياكل َعم 
القرار القائمة في مكانهاء axis‏ الوصول إلى البيانات من تلك المصادر كلما لزم الأمر. كما يتم 
دَعْم النهج الموحّد من قبل 53355( البرامج الوسيطة الذين يقترحون الاستعلامات ال موزّعة 
والقدرات المشتركة. تقدّم هذه الأدوات القابلة للتجديد والقائمة على لغة الترميز (XML)‏ 
للمستخدمين Â$)‏ شاملةً لمصادر البيانات الموزّعة: Le‏ في ذلك مستودعات البيانات» و 
DMs‏ وابلواقع الإلكترونية والمستندات والأنظمة التشغيلية. عندما يختار المستخدم كائنات 
الاستعلام من هذا العرضء ويضغط زر الإرسالء تقوم الأداة بالاستعلام التلقائي عن المصادر 
is EU‏ إليها النتائج» ومن 9 تُقدّمها للمستخدم. وبسبب مشكلات الأداء وجودة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


YEE 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


البيانات؛ يتفق معظم الخبراء على أن الطرق المتبعة تعمل بشكل جيد لتكملة مستودعات 
البيانات ولیس استبدالها (انظر: 2005 (Eckerson,‏ 





هياكل مستقلة لأسواق البيانات (a)‏ 
ETL 9‏ 
الوصول للمستخدم أسواق بيانئت مستقلة منطقة أنظمة 
| | النهائي والتطبيقات ) بيلنات صغيرة / موجزة ) التدريج العصدر 


هيكل حافلة سوق البيانات مع أسواق البيانات مرتبطة الأبعاد (b)‏ 




















zi بيانات محددة الأبعاد‎ focal 
iue ومربوطة بأبعاد متطابقة‎ | 
ps (بيانات صغيرة / موجزة)‎ 








) بيانات موجزة / صغيرة بعض (oll‏ 


صبكل مستودع البيانات المركزي (d)‏ 








ETL 
بيانات صغيرة / موجزة منطقة أنظمة‎ ١ 
يعض الشئ) التدريج المصدر‎ f 











التكامل المنطقي / المادي مستودع البيانات الحالية 
z i‏ ف لعناصر البيانات المشتركة أسواق البيانات والأنظمة القديمة 














شكل :A-Y‏ هياكل بديلة لمستودع البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yeo‏ 


الفصل الثالث 


ds aÍ m 0 às‏ من Watsong Ariyachandra‏ عشرة عوامل من المحتمل أن تؤثر على 
قرار اختيار الهيكل المستخدّم: 
-١‏ ترابط المعلومات بين الوحدات التنظيمية. 
-Y‏ احتياجات معلومات الإدارة العليا. 
-Y‏ الضرورة Adhi‏ طمستودع البيانات. 
-t‏ طبيعة مهام المستخدم ed‏ 
0- القيود على الموارد. 
1- عرض إستراتيجي للخزن البيانات قبل التنفيذ. 
-V‏ التوافق مع الأنظمة الحالية. 
-A‏ القدرة الملموسة لفريق عمل تقنية المعلومات الداخلي. 
4- المشكلات الفنية. 


-V‏ العوامل الاجتماعية/ السياسية. 





وتتشابه هذه العوامل مع العديد من عوامل النجاح الموصوفة في الأدبيات الخاصة مشاريع 
نظم ال معلومات ومشروعات DSS‏ وذكاء الأعمال؛ إذ 355 المسائل الفنية - بخلاف توفير التقنية التي 
تكون las‏ جاهزةً للاستخدام - أمرًا daga‏ ولكنها (OUS‏ لا تكون caga‏ مثل المشكلات السلوكية, 
مثل: تلبية احتياجات المعلومات الخاصة بالإدارة العلياء ومشاركة المستخدمين في عملية التطوير 
(عامل اجتماعي/ سياسي). ولكلّ هيكل من هياكل مستودعات البيانات تطبيقات خاصة به متفاوتة 
الفاعليةء وبالتالي؛ توفر فوائد قصوى للمنظمة. ومع ذلك يبدو بشكل عام أن هيكل DM‏ هو الأقل 
فعالية في الاستخدام. وللمزيد من التفاصيل الإضافية انظر: Ariyachandra‏ و(20062) -Watson‏ 


أي البُبيات هي الأفضل؟ 

منذ أن أصبحت مستودعات البيانات حزءًا مهمًا من المؤسسات الحديثةء بات السؤال عن بنية 
مستودع البيانات الأفضل؛ هو موضوع المناقشة الدائمة. ويترَّعُم هذه المناقشات اثنان من زعماء 
مجال مستودعات البيانات. هما: Gls Ralph Kimball; Bill Inmon‏ ما يدافع Inmon‏ عن بنية 
hub-and-spoke‏ (مثل: مصنع المعلومات المؤسسية). في حين Kimball e3‏ لحافلة هيكل DM‏ ذات 
الأبعاد المطابقة. وهناك هياكلٌ أخرى ممكنة؛ ولكن هذان الخياران هما نهجان مختلفان dle 4 ase‏ 
logia‏ مناصرون أقوياء. ولإلقاء الضوء على هذا السؤال المثير للجدلء أجرى ds‏ من Ariyachandra‏ 
Watson (2006a)s‏ دراسةً تجريبيةً. ولجمع البيانات قاما بإجراء استطلاع على الويب استهدفا فيه 
كان ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


الأفراد المشاركين في عمليات تنفيذ مستودع البيانات. GAAS‏ الاستطلاعٌ ias à All‏ عن القائم 
بالإجابة عنه» وعن «tips‏ ومستودع بيانات الشركةء ومدى نجاح هيكل مستودع البيانات. 


& للاستخدام. وتراوحت الشركاتٌ التي‎ GB من المجيبين معلوماتٍ‎ EOE PiS SG el 
مليون دولار) إلى كبيرة (ذات عائدات تزيد على‎ ٠١ استطلاعها من صغيرة (ذات عائد أقل من‎ 
A) مليار دولار). كانت معظم الشركات موجودةٌ في الولايات ال متحدة بنسبة بلغت‎ ٠ 
من الصناعات» وشكلت صناعة الخدمات المالية معظم الاستجابات‎ sgio ومثلت مجموعةً‎ 
تليها‎ (XY) بنسبة‎ hub-and-spoke بنسبة بلغت )230( كانت البنية السائدة؛ هى بنية‎ 
QUY) المستقل بنسبة‎ DMs ثم هيكل‎ QW) ثم البنية ا مركزية بنسبة‎ (XY) بنية الحافلة‎ 
وجاء في المرتبة الأخيرة الهيكل المتحد بنسبة (6*). وكان النظام الأساسي الأكثر شيوعًا لاستضافة‎ 
«XM8) بنسبة‎ (Microsoft) مايكروسوفت‎ Ub (XEN) بنسبة‎ Oracle مستودعات البيانات هو‎ 
مليار دولار أمريكي‎ Y. وتراوح معدل (متوسط) الدخل الإجمالي من‎ 0M) بنسبة‎ IBM ثم‎ 
مليار دولار للهيكل المتحد. وقد استخدموا أربعة مقاييس لتقييم‎ t المستقلة إلى‎ DMS ل‎ 
التأثيرات الفردية» 5 )€( التأثيرات‎ (Y) جودة النظام‎ (Y) جودة المعلومات,‎ (V) نجاح الهياكل:‎ 
blo نقاط؛ إذ تشيرٌ الدرجة الأعلى إلى بنية أكثر‎ V التنظيمية. واستخدمت الأسئلة مقياسًا من‎ 
متوسط نتائج اللقاييس لهياكل مستودعات البيانات.‎ V-Y الجدول‎ adgs 





























DMs‏ هيكل hub- JS‏ الهيكل المركزي الهيكل 

المستقلة | الحافلة | and-spoke‏ | (لا تعتمد على (DMs‏ | المتحد 

£N ov o5 0, £,£Y جودة المعلومات‎ 

جودة النظام £30 ,0 0,01 01 £41 

0,01 0,67 ors oA | 0,۸ التأثيرات الفردية‎ 

التأثيرات التنظيمية | 5,775 | EVV 0, o,f o,‏ 
وكما تشيرٌ نتائجٌ الدراسة؛ سجّلت DMs‏ المستقلة gof‏ الدرجات على جميع المقاييس. وتؤكّد 





هذه النتيجة على الحكمة التقليدية التي تقول بضعف Jodl‏ الهيكلي PÁI‏ من DMs‏ المستقلة. 
وجاء الهيكل الموحّد في المركز قبل الأخير. وتمتلك الشركات في بعض الأحيان منصّات دعم قرارات 
متباينة ناتجة عن عمليات الاندماج فيما بين الشركات» وقد تختار الطريقة ا متحدة على الأقل 
على المدى القصير؛ إذ تشيرٌ النتائج إلى أنَّ PAANI adi‏ من الهيكل المتحد ليس هو الأمثل على 
المدى الطويل. لكن الشيء امثير للاهتمام هو التشابه في المتوسطات بالنسبة S‏ من الحافلة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YEY‏ 


الفصل الثالث 


hub-and-spokes‏ والهياكل المركزية. وتكون الاختلافات صغيرة ها فيه الكفاية؛ بحيث لا يمكن 
تقديمٌ (el‏ مطالبات لتفوق هيكل معين على الهياكل الأخرى» على الأقل استنادًا إلى مقارنة بسيطة 
بين هذه المقاييس للنجاح. كما قاموا gify‏ بيانات عن النطاق (والتي يتراوح من وحدة فرعية 
إلى نطاق الشركة) وحجم ssl)‏ كمية البيانات المخزّنة) المستودعات. 

كما وجدوا أن hub-and-spoke åå‏ تُستخدّم عادة مع تطبيقات أكثر على مستوى اللؤسسة 
ومستودعات أكبر. وقاموا أيضًا بالتحقيق في التكلفة والوقت اللازمين لتنفيذ الهياكل المختلفة. 
(Sc)‏ عام؛ كانت بنية hub-and-spoke‏ هي الأكثر ASS‏ واستهلاكًا للوقت لتنفيذها. 


أسئلة مراجعة على القسم -Y‏ 

-١‏ ما هي أوجه التشابه والاختلاف الرئيسية بين هيكلٍ من طبقتينء وهيكل GG‏ الطبقات؟ 

-Y‏ كيف SÍ‏ الويبٌ على تصميم مستودع البيانات؟ 

۴- اذكر هياكل مستودعات البيانات البديلة التي تمت مناقشتها في هذا القسم. 

-é‏ ما هي المسائل الواجب أخذها في الاعتبار عند تحديد البنية التي سئس تَخِدَّم في تطوير 
مستودع البيانات؟ اذكر ٠١ eal‏ عوامل. 

gi -0‏ من هياكل مستودعات البيانات هو الأفضل؟ وماذا؟ 


(ETL) تكامل البيانات وعمليات الاستخراج والتحويل والتنزيل‎ o-Y 

إن الضغوط التنافسية العامميةء والطلب على Sle‏ الاستثمار (RON‏ والإدارة والاستفسار عن 
المستثمرين واللوائح الحكومية؛ JS‏ هذه الأمور تجبر مديري الشركات على إعادة التفكير في كيفية 
g3‏ وإدارة أعمالهم» Bale‏ ما gilo gla‏ القرار أن La‏ إلى مصادر متعددة للبيانات» والتي 
يجب أن تكون متكاملةً. وقد كانت عمليةٌ الوصول إلى مصادر البيانات عملية شاقةٌ وكبيرةٌ؛ وذلك 
قبل مستودعات البيانات» IDDMss‏ وبرمجيات ذكاء الأعمال. وحتى مع أدوات إدارة البيانات 
الحديثة والتي uas‏ على شبكة الإنترنت؛ فإن التعرّف على البيانات التي يمكن الوصول إليها 
وتقديمها إلى gilo‏ القرار هي مهمةٌ غير ضرورية: غير أنها تتطلب متخصصين في قواعد البيانات 
ومع $6 حجم مستودعات البيانات تزداد مشكلات دمج البيانات هي الأخرى. 

Ol‏ تحليل الأعمال يحتاج إلى تطؤر مستمر؛ إذ GL‏ لعمليات الاندماج والاستحواذ والمتطلبات 
التنظيمية وإدخال قنوات جديدة أن تؤدي إلى تغييرات في متطلبات ذكاء الأعمال. وإضافةً إلى 
البيانات التاريخية والمنظفة والموحّدة والمتحصّل عليها في الوقت المناسب؛ là‏ مُستخدمي الأعمال 


YEA‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


يحرصون على الوصول إلى البيانات غير المهيكلة à‏ الوقت المناسب m‏ تأخير. ويجبٌ أن يتكامل 
DU js‏ مع محتويات مستودع البيانات الموجود. علاوة de‏ ذلك؛ | صبح dell‏ عبر أجهزة 
المساعد الرقمي الشخصي (PDA)‏ ومن خلال التعرّف على الكلام والتوليف أكثر شيوعًا؛ مما يزيد 
من تعقيد قضايا التكامل )2003 (Edwards,‏ وتتضَّمّن العديدٌ من مشاريع التكامل أنظمة على 
مستوى المؤسسة. وقد Orovic p35‏ في ۰۳م 4i‏ مرجعيةٌ بما يصلح وما لا يصلح عند محاولة 
القيام بمشروع من هذا القبيل. ومن الصعب 33& البيانات التي تأي من قواعد بيانات مختلفة 
وغيرها من المصادر اللتباينة؛ خاصةً عندما لا يتم ذلك بشكل صحيح؛ إذ إنه من الممكن أن يؤدي 
إلى كارثة في أنظمة واسعة النطاق مثل ERP: CRM‏ ومشاريع سلاسل التوريد )2002 -(Nash,‏ 
تكامل البيانات: 

forio‏ تكاملٌ البيانات على ثلاث عمليات رئيسية؛ هذه العمليات عندما يتم تنفيذها بشكل 
صحيح؛ فإنها تسمح بالوصول إلى البيانات وإتاحتها لمجموعة من ETL‏ وأدوات التحليل» وبيئة 
مستودعات البيانات» وهذه العمليات هي: الوصول إلى البيانات: وتعني القدرة على الوصول 
إلى البيانات واستخراجها من (Sl‏ مصدر بيانات» اتحاد البيانات؛ أيْ: تضمين آراء الأعمال في مخزن 
البيانات المتعددة, تغيير الالتقاط؛ والذي يتم Uo‏ على تحديد التغييرات التي 3 تمّ إدخالها على 
مصادر بيانات المؤسسة. انظر الحالة العملية Y-Y‏ للاطلاع على مثالٍ لكيفية الاستفادة من BP‏ 
Lubricant‏ في تنفيذ مستودع بيانات يدمج البيانات من عدة مصادر. فقد قام بعص المورّدين» 
مثل SAS Institute, Inc‏ بتطوير أدوات تكامل البيانات بشكل قوي. ويتضمّن مشروع تكامل 
البيانات SAS‏ للمؤسسة أدوات تكامل بيانات العملاء التي تعمل على تحسين جودة البيانات في 
عملية التكامل. كما يساعد Lj Oracle Business Intelligence Suite‏ على تكامل البيانات. 

ويتمثل الغرض الرئيسي من مستودع البيانات في دَمُج البيانات من أنظمة مُتعدّدة؛ بحيث 
تتيح تقنيات التكامل المختلفة دمج البيانات والبيانات الوصفية: 
- تكامل تطبيقات المؤسسات EAD‏ 
- العمارة الموجهة نحو الخدمة (SOA)‏ 
- تكامل معلومات المؤسسة EH)‏ 
- الاستخراج والتحويل والتحميل (ETL)‏ 

also $a‏ تطبيقات المؤسسات (EAT)‏ وسيلة لدفع البيانات من أنظمة المصدر إلى مستودع 
البيانات. وهو ينطوي على دَمْج وظائف التطبيقات ويركّز على مشاركة الوظائف Ja)‏ من 
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الفصل الثالث 


البيانات) عبر الأنظمة» وبالتالي تمكين المرونة وإعادة الاستخدام. وعلى نحو تقليدي؛ فقد DŠ‏ 
حلول تكامل تطبيقات المؤسسات (EAD)‏ على تمكين إعادة استخدام التطبيق على مستوى واجهة 
برمجة التطبيقات. وف الآونة الأخيرة؛ يتم إنجاز تكامل تطبيقات المؤسسات (EAT)‏ باستخدام 
خدمات (SOA)‏ (والتي هي مجموعة من العمليات أو المهام التجارية) التي تم تعريفها وتوثيقها 
بشكلٍ جيد. dads‏ استخدام خدمات شبكة الإنترنت طريقةً ads‏ لتنفيذ (SOA)‏ كما يكن 
استخدامٌ (EAT)‏ لتسهيل الحصول على البيانات مباشرةً في مستودع بيانات شبه فوري أو لتوصيل 
القرارات إلى أنظمة OLTP‏ وهناك Lah‏ من الطرق والأدوات المختلفة لتنفيذ EAD)‏ 
isig‏ تكامل معلومات المؤسسات (EI)‏ مجالًا جيدًا باعتباره Bal‏ متطورةٌ تقوم gla‏ 
البيانات الواردة من مجموعة متنوعة من المصادر في الوقت xal‏ مثل: قواعد البيانات 
اطمترابطةء وخدمات شبكة الإنترزنت» وقواعد البيانات المتعددة الأبعاد؛ بالإضافة إلى كونه &JI‏ 
cao‏ البيانات من أنظمة المصدر لتلبية طلب الحصول على المعلومات. وتستخدم أدوات (EI)‏ 
بيانات التعريف المعرّفة مسبقًا لتجميع وجهات النظر التي تجعل البيانات المدمجة (المتكاملة) 
تبدو dla‏ بالمستخدمين النهائيين» وقد يكون XML‏ هو الجانب الأكثر iaa‏ في EI‏ وذلك لأن 
XML‏ يسمح gés‏ علامات على البيانات إما في وقت الإنشاء أو في وقت لاحق» وهذه العلامات 
يمكن توسيعها وتعديلها ما يسمح باستيعاب أي مساحة من المعرفة (انظر: 2005 (Kay,‏ 

ولطاما كان تكامل البيانات المادية؛ هو الآلية الرئيسة gial‏ نظرة متكاملة مع مستودعات 
البيانات .DMss‏ ومع ظهور أدوات تكامل معلومات المؤسسة (EIT)‏ (انظر: 2005 ol (Kay,‏ 
أنماط تكامل البيانات الافتراضية الجديدة أصبحت doas‏ وقابلةً للتطبيق» وقد ناقش JS‏ من 
Manglik‏ و(2005) Mehra‏ فوائد وقيود أنماط تكامل البيانات الجديدة التي هكن أن توشع 
المنهجيات المادية التقليدية لتقديم رؤية شاملة للمشروع. 





حالة عملية Y-Y‏ 
بريتش بتروليوم BP‏ مواد التشحيم تحقق نجاح BigS‏ 
قامت شركة بريتش بتروليوم لزيوت التشحيم بتأسيس برنامج BigS‏ لمتابعة نشاط 
الدّمج الأخير لتوفير معلومات إدارة متسقة وشفافة على مستوى العام؛ إضافةً إلى تقديم 
ذكاء الأعمالء و8185 في الوقت المناسب والذي يوفر عرضًا تفصيليًا ومتكاملًا للآداء عبر 
وظائفء مثل: gaill‏ والتسويق والمبيعات. والإمدادات وخدمات التخطيط والتنفيذ. 


vo.‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


Sazla BP i359‏ من أكبر مجموعات النفط والبتروكيماويات في العام؛ إذ تُعَدُ جزءًا 
من مجموعة BP plc‏ فشركة BP‏ ملواد التشحيم هي شركة Sail‏ في سوق السيارات 
العلميةء وتشتهر الشركة بعلامة زيوت كاسترول (Castrol)‏ التجاريةء كما تعمل في أكثر 
من مائة دولة ولديها عشرة آلاف موظف. ومن الناحية الإستراتيجية؛ 55 شركة BP‏ 
مواد التشحيم تركّز على تحسين خدمة عملائهاء وزيادة فاعليتها في أسواق السيارات. 
ds‏ أعقاب blis‏ الاندماج مؤخرًا 5 الشركة بعملية J$23‏ لتصبح أكثر فاعليةً ومرونة 
واغتناماً لفرص النمو السريع. 

التحَدَّي: 

عقب نشاط الاندماج الأخير أرادت شركة BP‏ مواد التشحيم s aed‏ الاتساق 
والشغفافيةء وسهولة الحصول على معلومات الإدارة وذكاء الأعمال. وللقيام بذلك كان 
من الضروري دمج البيانات المُحتفَظ بها في أنظمة مصدر معدل التوزيع دون التأخير في 
إدخال نظام مُوحّد لتخطيط موارد المؤسسات. 

الحل: 

od‏ شركة BP‏ يواد التشحيم برنامج «ذكاء الأعمال التجارية والمعابير العالمية» 
(Bigs)‏ وهي مبادرةٌ إستراتيجيةً لإدارة وذكاء الأعمال. Č ds‏ برنامج BigS‏ يُوجَد ما cd‏ 
Kalido‏ وهو حل EDW‏ التكيّفي لإعداد وتنفيذ وتشغيل وإدارة مستودعات البيانات. 

وقد آمهم EDW Jo‏ المتكامل من Kalido‏ في دَعْم تكامل البيانات المعقدة للبرنامج 
التجريبي ومتطلبات تقديم التقارير المتنوعة. cà IS‏ مع متطلبات إعداد التقارير 
المتطؤرة للبرنامج؛ فقد تمن البرنامج Laid‏ من تعديل بنية المعلومات الأساسية بسهولة 
عالية مع الحفاظ على جميع المعلومات؛ إذ يقوم النظام بدَمْج وتخزين المعلومات من 
نظمة مصادر متعددة لتوفير طرق عرض مُوحّدة من أجل: 

- تسويق العائدات والهوامش الخاصة بالعميل بالنسبة لقطاعات السوق مع 
التعمق في تفاصيل مستوى الصوت. 

- زيادة التقارير الخاصة بفواتير المبيعات والتكاليف الجمركية التفصيلية والرواتب الفعلية. 

- تقديم بيانات الأرباح والخسائر والميزانية العمومية وبيانات التدفق النقدي 
الموحّدة على الصعيد العالمي. مع التدقيق في مراجعة حسابات العملاء والديون 
وخدمات التخطيط والتنفيذ؛ بحيث يتم معالجة الحركة وَعَرْضها من خلال نظام موحّد 
عبر منصات ERP‏ متعددة في نظام تخطيط موارد المؤسسات. 
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الفوائد: 

iss‏ 5هذ8 المعلومات اللازمة لمساعدة الأعمال التجارية على تحديد عد وافر من 
الفرص التجارية؛ من خلال تحسين رؤية البيانات المتسقة ف الوقت اممناسب؛ من أجل 
تحقيق أقصى قدرٍ من فرص العمل لزيادة الهوامش أو إدارة التكاليف المرتبطة بها. 

وتتضمّن الاستجابات النموذجية لفوائد البيانات المتسقة الناتجة عن 8185 ما يلي: 

- تحسين التناسق والشفافية في بيانات الأعمال. 

- إعداد تقارير أسهل وأسرع وأكثر مرونة. 

- التوافق بين المعايير العالمية والمحلية على a5‏ سواء. 

- دورة تنفيذ سريعة وفعّالة؛ من حيث التكلفة بالإضافة إلى مرونتها. 

- أقل قدرٍ من الاضطراب للعمليات التجارية القائمة والأعمال اليومية. 

- تحديد مشكلات جودة البيانات والتشجيع على dal‏ 

- تحسين القدرة على الاستجابة بذكاء للفرص التجارية الجديدة. 

أستلة للمناقشة: 

$BigS ما هو‎ -١ 

3BigS المقترح والنتائج التي 3& الحصول عليها مع‎ Jal وما هو‎ Sbil ما هي‎ -Y 
Sources: Kalido. BP Lubricants. http://kalido.com/download/BP-Lubricants.pdf 


(accessed July 2016); BP Lubricants, www.bp.com/en/global/corporate/about-bp/ 
bp-at-a-glance.html (accessed July 2016). 


الاستخراج» والتحويلء» والتحميل: 

يتضمّن الجانبٌ التقني من عملية مستودعات البيانات استخراج وتحويل وتحميل (ETL)‏ 
وتقوم تقنية (ETL)‏ - والتي كانت موجودةً منذ فترة قصيرة - بدور رئيس في العملية واستخدام 
مستودعات البيانات. ads‏ عملية استخراج وتحويل وتنزيل البيانات (ETL)‏ عنصراً أساسياً في أي 
مشروع بيانات مركزية. Js‏ ما يواجه مديرو تقنية ا معلومات OLAS‏ لأن عملية استخراج 
وتحويل وتنزيل البيانات Bale‏ ما تستهلك AVe‏ من الوقت في مشروع بيانات مركزية. 
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التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


تتكوّن عملية (ETL)‏ من: الاستخراج (ويعني: قراءة البيانات من قاعدة بيانات واحدة أو GS]‏ 
والتحويل ssl)‏ تحويل البيانات doe LM‏ من شكلها السابق إلى الشكل الذي تحتاج إليه؛ بحيث 
هكن وضعه في مستودع بيانات أو ببساطة قاعدة بيانات أخرى)؛ lal‏ إلى التنزيل e$ ssl)‏ البيانات 
في مستودع البيانات). ويحدث التحويل باستخدام القواعد أو جداول البحث أو عن طريق دمج 
البيانات ببيانات أخرى. ea eug‏ وظائف قواعد البيانات الثلاثة في أداة واحدة لسحب البيانات 
من واحدة أو أكثر من قواعد البيانات» ووَضُْعها في قاعدة بيانات أخرى daiga‏ أو مستودع بيانات. 

وتقوم أدوات Lái (ETL)‏ بنقل البيانات بين المصادر والأهداف وتوثيق كيفية تغيّر عناصر 
البيانات (كالبيانات الوصفية) في أثناء انتقالها بين المصدر والهدف؛ إضافةً إلى تبادل البيانات الوصفية 
مع التطبيقات الأخرى حسب الحاجة: وإدارة جميع عمليات التشغيل والعمليات الأخرى (مثل: 
الجدولة, وإدارة الأخطاء وسجلات التدقيق» والإحصائيات). X $g‏ عملية (ETL)‏ عمليةً في غاية 
الأهمية لتكامل البيانات» وكذلك لمستودعات البيانات. والغرض من هذه العمليةء هو تنزيل 
المستودع ببيانات مُدمَجة ومنتقاة. ومن الممكن أن ls‏ البيانات adea‏ في عملیات(۴۲1) من 
(gl‏ مصدر ك: تطبيق حاسب مركزيء أو تطبيق (ERP)‏ أو أداة CRM‏ أو ملف ثابت» أو جدول 
بيانات Excel‏ أو حتى قائمة انتظار رسائل. وفي الشكل -؟ نحَدَّد الخطوط العريضة لعملية ELT)‏ 

















نظام قديم 











داخلية أخري 


























شكل 4-8: عمليات ETL‏ 
وتنطوي عملية ترحيل البيانات إلى مستودع البيانات على التنقيب في البيانات من جميع 
المصادر ذات Lall‏ 4 وقد تتكوّن jalas‏ البيانات من ملفات مُس Ali‏ من قواعد بيانات 
OLTP‏ وجداول البيانات» وقواعد البيانات الشخصية (على سبيل المثال: «(Microsoft Access‏ 
أو الملفات الخارجية. boles‏ ما e3‏ كتابة كافة ملفات الإدخال في مجموعة من الجداول ASSL‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vor‏ 


الفصل الثالث 


والتي يتم تصميمها من أجل تسهيل عملية التنزيل. ويحتوي مستودع البيانات على العديد 
من قواعد العمل التي تحَدَّد أشياء» مثل: كيفية استخدام البيانات» وقواعد التلخيص» وتوحيد 
السّمات المشفرة وقواعد الحساب. ويجب تصحيح البيانات المتعَلّقة بملفات المصدر قبل تنزيلها 
في مستودع البيانات. ومن فوائد مستودع البيانات المصمّم تصميمًا حيدًا هو أن هذه القواعد 
يمكن تخزينها في مستودع البيانات الوصفية» وتطبيقها على مستودع البيانات بشكل مركزي. 
وهذا يختلف عن طريقة OLTP‏ التي تحتوي عادةً على قواعد البيانات والأعمال التجارية 
المنتشرة في جميع أنحاء النظام. ويمكن إجراء عملية تنزيل البيانات في مستودع البيانات ÚJ‏ من 
خلال أدوات تحويل البيانات التي توفر واجهة مُستخدم رسومية للمساعدة في تطوير وصيانة 
قواعد الأعمال التجاريةء أو من خلال طرق أكثر تقليديةء مثل تطوير البرامج أو الأدوات المساعدة 
لتنزيل مستودع البيانات؛ وذلك باستخدام لغات البرمجة, مثل: لغات PL/SQL‏ أو +C‏ أو 
gl Java‏ دوت نت Framework‏ وهذا القرار ليس سهلا بالنسبة للمنظمات؛ إذ تؤثر العديدٌ 
من المشكلات على قرار المؤسسة بشراء أدوات تحويل البيانات» أو إنشاء عملية التحويل نفسهاء 
وتتمثل هذه المشكلات في: 
- أدوات تحويل البيانات الغالية الثمن. 
- قد يكون لأدوات تحويل البيانات منحنى تعلّم طويل. 
- من الصعب قياس أداء منظمة تقنية المعلومات؛ حتى elu‏ المنظمة استخدام أدوات تحويل البيانات. 

وعلى المدى الطويل؛ ينبغي تبسيط نهج صيانة أداة تحويل مستودع البيانات للمنظمة. ومن 
الممكن أن تكون أدوات التحويل Lái‏ فعًالة في الكشف والتنظيف (معنى إزالة أية حالات شاذة 
في البيانات). وتعتمد OLAP‏ وأدوات التنقيب في البيانات على مدى جودة تحويل البيانات. 

وكمثالٍ على (ETL)‏ الفعّالة؛ فإن شركة Motorola, Inc‏ تستخدم (ETL)‏ لتغذية مستودعات 
البيانات الخاصة بها؛ إذ تقوم شركة Motorola‏ بتجميع المعلومات من ثلاثين نظامًا مختلقًا 
للمشتريات. ومن ثم تقوم بإرسالها إلى مستودع بيانات SCM‏ العاطمي لتحليل إجمالي إنفاق 
الشركة. (انظر: 2004 .(Songini,‏ 

وقد Solomon (2005) cà o‏ تقنيات ETL‏ إلى أربع فئات» وهي: متطورة وممكنة 
وبسيطةء وبدائية. ومن المس el‏ به Bgas‏ أن أدوات الفئة المتطورة ستؤدي إلى توثيق عملية 
Kis ETL‏ أفضل وأكثر دقة مع تطؤر مشروع مستودع البيانات. 
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وعلى الرغم من أنه من الممكن للمبرمجين تطوير برنامج من أجل ETL‏ فإنه من الأسهل 
استخدام أداة ETL‏ القائمة (الموجودة بالفعل). ونعرض فيما يلي لبعض المعايير المهمة في اختيار 
أداة ETL‏ (انظر: 2004 (Brown,‏ 
- القدرة على القراءة والكتابة إلى عدد غير محدود من أساليب بناء مصادر البيانات. 
- التقاط تلقائي للبيانات الوصفية وتسليمها. 
- تاريخ المطابقة للمعايير المفتوحة. 
- واجهة سهلة الاستخدام للمطوّر والمستخدم الوظيفي. 

قد يكون ETL slol‏ الشامل dae‏ على سوء إدارة البيانات» ونقص أساسي في إستراتيجية إدارة 
بيانات متماسكة. وقد أشار )2006( Karacsony‏ إلى وجود علاقة مباشرة بين حجم البيانات المتكررة 
وعدد عمليات ETL‏ فعندما يتم إدارة البيانات بشكلٍ صحيح كأصل ممؤسسة؛ OP‏ جهود ETL‏ 
تنخفض sS US da‏ كما يتم aliah‏ من البيانات المتكررة بالكامل. مما يؤدي إلى توفير كبير في 
الصيانة وزيادة الكفاءة في التطوير الجديد مع تحسين جودة البيانات. Ol‏ سوء تصميم عمليات 
ETL‏ يجعل تكلفة صيانتها وتغييرها وتحديثها باهظة. stas‏ على ذلك؛ فإنه من الأهمية بمكان 
اتخاذ الخيارات المناسبة من حيث التقنية والأدوات لاستخدامها في تطوير وصيانة عملية ETL‏ 

ويتوفر SA e‏ من أدوات ETL‏ المجمّعة؛ إذ يقوم 9255 قواعد البيانات lb‏ بتوفير 
قدرات ETL‏ التي تعمل على تحسين أدوات ETL‏ المستقلة والتنافس معها. وتقرٌ SAS‏ 
بأهمية جودة البيانات eds‏ أول حل متكاملٍ تماما في هذه الصناعة يدمج ETL‏ 
وبيانات نوعية لتحويل البيانات إلى قيمة الأصول الإستراتيجية» ومن بين مُزؤدي برامج 
ETL‏ الآخرين شركات مايكروسوفت Oracleg (Microsoft)‏ و1821 Jnformaticag‏ 
.Tibcos .Embarcaderos‏ وللحصول على معلومات إضافية حول ETL‏ انظر: Golfarelli‏ و 
«Rizzi (2009)‏ و(2006) Karacsony‏ و(2004) -Songini‏ 


أسئلة مراجعة القسم :0-Y‏ 

-١‏ صف تكامل البيانات. 

ETL صف الخطوات الثلاث لعملية‎ -Y 

-Y‏ اذا A53‏ عملية ETL‏ مهمةً جدًّا لجهود مستودعات البيانات؟ 
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1-۳ تطويرٌ مستودع البيانات: 
dad‏ مشروع مستودعات البيانات مهمةً GY bus‏ مؤسسة» وهو E SÍ‏ تعقيدًا من مشروع 

اختيار وتنفيذ حاسب مركزي بسيط؛ نظرًا لأنه يضم العديد من الأقسام والعديد من واجهات 
الإدخال والإخراج بالإضافة إلى تأثيره عليهاء كما أنه من اممكن أن يكون جزءً! من إستراتيجية عمل 
CRM‏ ويوفّر مستودع البيانات العديدّ من المزاياء والتي هكن تصنيفها إلى مزايا مباشرة ومزايا 
غير مباشرة. وتتضمّن المزايا المباشرة ما يلي: ١‏ 
E‏ يمكن للمستخدمين النهائيين thol‏ تحليل مستفيض بطرق متعددة. 
- يكن توحيدٌ وجهات النظر فيما يتعلّق ببيانات الشركة (أَيْ: إصدار صيغة واحدة للحقيقة). 
S -‏ الحصولٌ على معلومات أفضل وفي الوقت المناسب؛ إذ يسمحٌ مستودع البيانات بمعالجة 

المعلومات؛ Sad‏ إعفاؤها من أنظمة التشغيل dl‏ إلى خوادم منخفضة التكلفة. ولذلك؛ فإنه 

من الممكن معالجة الكثير من طلبات الحصول على معلومات للمستخدم الأخير بسرعة أكبر. 
- يكن أن يؤدي إلى مستوى أداء أفضل؛ إذ يُحرّر مستودع البيانات عملية الإنتاج؛ نظرًا OS‏ بعض 

متطلبات تقارير نظام التشغيل يتم نقلها إلى -DSS‏ 
- تبسيط الوصول إلى البيانات. 

وتنشا المزايا غير المباشرة dou‏ لاستخدام المستخدمين النهائيين للمزايا المباشرة. وبشكل عام؛ 

فإِنَّ هذه المزايا 555 المعرفة بالأعمال التجارية» وتقدّم IS‏ تنافسية؛ إضافةٌ إلى تحسين خدمة 
العملاء وإرضائهم» كما أنها تُسهّل اتخاذ القرارء وتساعد في إصلاح العمليات التجارية. وبالتالي؛ OB‏ 
مستودعات البيانات ead‏ بشكلٍ قوي لإضفاء j4‏ تنافسية للمؤسسات Parzinger & Frolick,)‏ 
2001( وللاطلاع على مناقشة مُفصّلة حول LAS‏ حصول المؤسسات على مستويات استثنائية من 
الأرباح» انظر: Goodhues Watson‏ و(2002) -Wixom‏ ونظرًا للفوائد المحتمّلة التي يمكن أن 
يوفرها مستودع البيانات والاستثمارات الكبيرة في الوقت والمال التي يتطلبها هذا المشروع؛ فإنه 
من الأهمية بمكان أن تقوم المؤسسة بتنظيم مشروع مستودع بياناتها لتحقيق أقصى قدرٍ من فرص 
النجاح. وإضافة إلى ذلك duos‏ على المؤسسة بطبيعة الحال أن تأخذ في الاعتبار التكاليف. وقد 
وَصَف )2001( Kelly‏ منهج عائد الاستثمار (ROT)‏ والذي يأخذ في الاعتبار blja‏ فئات عمليات 
الحفظ (أَيْ: الأموال التي يت توفيرها من خلال تحسين وظائف ذَعْم القرار التقليدية)» والجمع 
ssl)‏ الأموال التي يتم توفيرها بسبب جمع المعلومات ونشرها (ÉT‏ والممستخدمين (أيْ: الأموال 
المحفوظة أو المكتسّبة من القرارات التي يتم اتخاذها باستخدام مستودع البيانات). وتشمل 
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لتكاليف JS‏ ما يتعلق بالأجهزة» والبرمجيات» والنطاق التردّدي ALAU‏ والتنمية الداخلية؛ ABL!‏ 
إلى العم الداخلي» والتدريبء والاستشارات الخارجية. ex‏ حساب القيمة الحالية الصافية على 
مدى العمر المتوقع المستودع البيانات. ونظرًا لأن المزايا تقس م تقريبًا XY d)‏ لعمليات الحفظ 
gand YY «9‏ 0*5 للمستخدمين؛ 438 أشار Kelly‏ إلى Sd‏ يجب إشراك المستخدمين في عملية 
لتطويرء والذي 385 عامل نجاح حاسم للأنظمة التي (uin‏ بالتغيير في المنظمة. 

edis‏ الحالة العملية Y-Y‏ مثالا لمخزن البيانات الذي تمّ تطويره» وتنفيذه على أساس تنافس شديد 
لشركة مبيعات تجزئة هولنديةء وقد أذّى الجَمْع بين قدرات مستودعات تيراداتا التخزينية والقدرات 
التحليلية مع وجود بنية تحتية للمؤسسة باستخدام حلول SAP‏ إلى تحقيق نجاح هائل في السوق. 





حالة عملية ٣-۳‏ 
استخدام تحليلات تيراداتا لحلول SAP‏ تُسرّع عملية تسليم البيانات الكبيرة 

إِنَّ الشركة التي تمّ تصنيفها ضمن هذه الدراسة الخاصة باقتناء qaad‏ هي عبارة 
عن شركة مملوكة ملكية خاصة لتاجر تجزئة هولنديء وتتكون من * YA*‏ متجرء هذا 
التاجر لديه ٠١‏ علامة تجارية مختلفة عبر العديد من الدول الأوروبية. تشمل منتجات 
عديدة من ألعاب الأطفال إلى أدوات الطهي. وكل علامة تجارية لها البنية التحتية 
الخاصة بها. و: تتم إدارة US‏ كيان تجاري بشكلٍ مستقل عن باقي ال ٠١‏ شركة الأخرى؛ 
وذلك في me‏ تطوير عملياته. والحفاظ على أنظمة 51,5« واتخاذ القرارات التجارية 
لخاصة بالتمويل وتقنية المعلومات» وسلسلة التوريد والعمليات العامة. 

الخلفية: 

ومن أجل تلبية احتياجات بيئة تنافسية دائمة التطؤر؛ Óp‏ ذلك c. lao‏ رؤيةٌ علميةٌ 

عمال؛ وهو الأمر الذي aas Jte‏ لمتاجر التجزئة الكبيرة لهذا التاجر الهولندي مع قيام ٠١‏ 

dae‏ تجارية مستقلة بإدارتها. وللحصول على رؤية أفضل وزيادة كفاءة الأعمال وانخفاض 
التكاليف؛ قزر بائع التجزئة وضع إستراتيجية مشتركة لإدارة البيانات في نظام مركزي باستخدام 
قسم تقنية معلومات واحد. وتعني مركزية البيانات أنَّ جميع العلامات التجارية سوف تتم 
دارتها في مستودع بيانات «tos‏ وتنفيذها حسب العلامة التجاريةء مع مراعاة العمليات 
التجارية الفردية واحتياجات JS‏ كيان مستقل. ويتمثل أك تحدٌ يواجه متاجر التجزثة الكبيرة 
في ضرورة gs‏ العديد من Le Aabi‏ في ذلك أنظمة (SAP ERP)‏ الخاصة بال )10( علامة 
تجارية» وأنظمة إدارة ا مستودعات» وأنظمة نقطة البيع (POS)‏ والبيانات الرئيسة للمواد. 
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ومع التركيز على الحفاظ على مرونة الحركة التجارية للمبيعات وتحليل الهامش؛ فقد 
كان هدف تاجر التجزئة هو توفير الوصول إلى مستوى معاملات البيانات الناشئة مما 
يقرب من *0 جدول SAP‏ داخل JS‏ نظام ERP‏ وقد زاد الأمرُ تعقيدًا خاصةً فيما يتعلق 
بالانتقال إلى edi‏ مركزي؛ بسبب الفروق الدقيقة عبر نظام تخطيط موارد الخمس عشرة 
علامة تجارية. وقد احتاج العمل على إدخال هذه البيانات في المستودع المركزي إلى ٤٠١‏ 
يوم من الجهد لكل نظام. وبالتالي؛ فقد احتاجوا إلى طريقة لتبرير نفقاتهم» وتطوير قيمة 
مقترحة مستمرة لنهج مستودع البيانات الخاصة بهم» وتطوير طريقة لتسهيل هذه العملية. 

قصة اكتساب المنتج: 

ومن الناحية التجارية؛ فإن التركيز cuan‏ على إنشاء d is‏ تحليلية مركزية مع 
إمكانية الوصول إلى رؤية شاملة لبيانات المعاملات. ونظرًا للطبيعة الموسمية للتجزئة؛ 
فإن القدرة على الاستفادة من بيانات عدة سنوات أمرٌ مهم للمساعدة في تحديد 
الاتجاهات الموسمية» وإنشاء التوقعات» وتطوير الأسعار والعروض الترويجية. ويكون 
الهدف من JS‏ ذلك هو تحسين الرؤية وتوفير حرية التحليلات عبر سلسلة التوريد والمواد 
والمبيعات والتسويق مساعدة هذه المؤسسة لتصبح أكثر كفاءةً في طريقة عملها. وبناءً 
على ذلك؛ فقد قام gib‏ التجزئة باختيار قاعدة بيانات تيراداتا؛ نظرًا لأنه يمكنه التعامل 
مع تحليلات المعاملات بالإضافة إلى توفير قدرات تحليلات متقدّمة. وكان هدفهم هو 
pt5‏ التحليلات التشغيلية وا مرونة عن طريق تنزيل البيانات دون تطوير نظام DMS‏ 
أو نماذج منطقية أخرى قبل طرح المستخدمين أسئلة الأعمال. وقد aiia‏ هذا الأسلوب 
من حفظ البيانات مركزيًا داخل قاعدة بيانات تيراداتا مع توفير المرونة المستقبلية التي 
تتعلق بالوصول إلى البيانات والتقارير والتحليلات لجميع العلامات التجارية. 

s‏ سبيل التقليل من تعقيدات SAP ERP‏ قضّت الشركة الأشهر الستة الأولى تعمل 
بكامل جهدها؛ من أجل تكامل SAP‏ للعملاء المحليين. وبعد ستة أشهر من العرض 
أدركوا المخاطرء وأوقفوا المشروع للتحقيق فيما إذا كانت هناك طرق أفضل للتعامل 
مع هذه المشكلة. ولأول مرة تقوم الشركة باستخدام نظام SAP SI‏ والذي احتاج 
تقريبًا ل 600 يوم حتى ex‏ فقط تنزِيلُ البيانات من أول نظام ل .SAP ERP‏ وهذا 
الأمرُلن )$5 5 fas‏ بالسرعة الكافية؛ لذلك فقد قام تاج ر التجزئة الهولندي بتصعيد 
المشكلة بتصعيد المشكلة ومحاولة استكشاف حل جديد يعمل بطريقة أوتوماتيكية في 
حل تيراداتا جديد يعمل بطريقة أوتوماتيكية في عمليات الحصول على البيانات عند 
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استخدام .SAP ERP‏ وقد وقع الاختيار على تحليلات تيراداتا لحلول SAP‏ نظرًا لأنه 
تم تصميمه خصيضًا لمعالجة التحَدِّيات المرتبطة بإحضار البيانات من SAP ERP‏ إلى 
قاعدة بيانات تيراداتا. كما يوفر gi (la) T Gg oJ!‏ بيانات SAP ERP‏ في 
مستودع البيانات كما eaa‏ من تنزيل البيانات المطلوبة للعلامة التجارية الأولى في 
غضون o‏ أيام فقط بدلا من ٠٠١‏ يوم المقدَّرة باستخدام النظام السابق. وقد قذى بائع 
التجزئة £0 Ggs‏ إضافيًا لإضافة Yo‏ جدولًا مخصصًا (Z)‏ وإعداد البيانات للاستهلاك. مما 
أدى إلى تسريع gid‏ بيانات SAP‏ بنسبة XA-‏ وبالتالي توفير Go 6٠‏ من العمل. 
التحَدّيات: 


يؤدي الجَمّع بين مشروع توحيد تخطيط موارد المؤسسات بالكامل عبر العديد 
من الأنظمة القدهة إلى إنشاء مشروع به العديدٌ من التعقيدات. وعلى الرغم من أن 
تحليلات تيراداتا لحلول SAP‏ قد أتاح التشغيل التلقائي لجزء إدارة البيانات المرتبطة ب 
SAP‏ من المشروع؛ OB‏ تاجر التجزئة Y‏ يزال يواجه تحديات فنية؛ بسبب حقيقة أن 
مبادرة مستودعات البيانات الخاصة به قد تمّ دمجُها مع مشروع تكامل أوسع. وكان 
النهج الذي اتبعوه هو توحيد الأدوات ووضع إطار عمل مع أول علامتين تجاريتين هكن 
تطبيقهما على الطرح التدريجي لبقية المنظمة. 

في البداية كانوا بحاجة إلى التوحيد القياسي على أداة ETL‏ وتطوير منهجية جديدة 
وطريقة الاستفادة من ETL‏ وقد استخدموا أداة ETL‏ كأداة تحويل (Extract ELT)‏ 
للتنزيل والحفاظ على تكامل بيانات المعاملات المعقدة. وقد انتهي هذا التاجرٌ إلى 
اختيار "Informatica‏ كمعيار ETL à 155 ETL‏ الخاصة به باستخدام ELT àls‏ 
SaaS‏ للبيانات وجدولة المهمة فقط. 

Lob‏ بالإضافة إلى تخزين بيانات المعاملات الدقيقة؛ فقد استطاع تاجر التجزئة 
الاستفادة من منصّة تيراداتا لتنفيذ جميع تحويلات الأعمال في قاعدة البيانات عند 
نقل البيانات إلى بيئة إعداد التقارير. وقد سمح لهم هذا النهج بالاحتفاظ بنسخة من 
المعاملات AASI‏ والاستفادة من عمليات التكامل خارج المربع المتوفرة في تحليلات 
تيراداتا لحلول SAP‏ بغرض إضافة سياق إلى بيانات SAP‏ وتسخير قوة قواعد البيانات 
لتطبيق التحويلات والتحليلات الأخرى. 

ثالثاً كان 3a‏ الحصول على بيانات عالية الجودة Bal‏ ضروريًا بالنسبة لهم. كما أنهم 
يريدون STI‏ من أن البيانات o‏ الوصول إليها وإدارتها على نحو مُتسق. وتوضّح 
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الأرقام المادية أهمية إدارة البيانات بالنسبة إلى هذا التاجر. وقد G5‏ تنظيمٌ أرقام المواد 
بشكل مختلفٍ عبر أنظمة متعددة, وكان من الممكن توفيقه ا خلال عملية التنزيل/ 
النموذج. وقد متهم هذا الهيكل الجديد من ME‏ على التحَدَّي الذي واجههم 
بسهولة من خلال إنشاء طرق عَرّْض المواد الفريدة في مستودع البيانات لتنسيق الأرقام 
المادية لإعداد التقارير. 

d, els‏ فقد كان الأمرُ $a) Jo c fla‏ ذكيةٌ لتقديم البيانات التحليلية والوصول 
للتقارير ا لمتخصصة. والتي Ul lice‏ أن áb‏ المتطلبات المتنوعة للعلامة التجارية. 


ومن خلال الاستفادة من شراكات تيراداتا مع non‏ الحلول “MicroStrategy Js‏ 
فقد تمن هذا التاجرٌ من الوصول إلى البيانات الدقيقة 5441 في مستودع البيانات في 
أثناء استخدام أدوات ذكاء الأعمال لتطبيق الخوارزميات المناسبة, والاستفادة من المرونة 
المصمّمة Jó ó‏ مستودع البيانات. 


ds‏ البداية؛ كان تطويرٌ مستودع البيانات باعتباره محوراً مركزب ا للوصول إلى 
البيانات؛ Geo Gal‏ بسبب الحاجة إلى تطوير إطار عمل جديد ومنحنى ell‏ العام 
بسبب التغيير في أسلوب تصميم مستودع البيانات. BA odds‏ فإنه بمجرد تطوير 
هذا الإطار. كان التکامل باستخدام برنامج تحليلات تيراداتا لحلول SAP‏ بسيطًا وقابلا 
للتكرار. ووفقاً لرؤية مخطط المشروع لدى متاجر التجزئة الأوروبية: di‏ برنامج 
تحليلات تيراداتا لحلول SAP‏ حلاً متكاملاً وسريعاً ومرناء كما أنه يحقق تنميةٌ أسرع, 
ويقلل نسبة المخاطرة, بالإضافة إلى كونه نموذجاً Salsas JV»‏ ويوفر الوصول المباشر 
إلى البيانات التفصيلية». 

الدروس المستقادة: 

وبوجه tele‏ فإن هدف تاجر التجزئة هو توفير إستراتيجية تنفيذ قابلة للتكرار؛ 
من خلال العلامات التجارية الخاصة بالشركة؛ وذلك من أجل تمكين أفضل القرارات في 
العمل؛ إضافةً إلى تحسين كفاءة الأعمالء وخفض تكاليف التشغيل من خلال مركزية 
تقنية المعلومات. ues‏ الرغم من أنهم ما زالوا في المراحل الأولى من المشروع؛ فإنهم قد 
تعلّموا من تنفيذ عملية دمج علامتهم التجارية الأولى في مستودع بيانات تيراداتا. ونظرًا 
لاستخدام صاحب الشركة لبرنامج تحليلات تيراداتا لحلول SAP‏ فقد تمكّنوا من تسريع 
وقت تقييم أنشطة التكامل وتبسيطها. إضافةً إلى eod‏ من تطوير بعض الفوائد 
التالية لتطبيقها على qo‏ علاماتهم التجارية اللاحقة وا مشاريع المماثلة. 
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وتتمثل هذه الفوائد فيما يلي: 

x 31 -‏ الوقت الكافي في العناية الواجبة والتعرّف على التقنيات/ الحلول المتوفرة 
لدعم عمليات التنفيذ. وفي هذه الحالة تمكن صاحب الشركة من الاستفادة من برنامج 
تحليلات تيراداتا لحلول SAP‏ مما أدى إلى تقليل وقت التقييم وتمكينه من التركيز على 
التحليلات بدلًا من التكامل. 

- تطوير إطار عمل لتمكين العمليات المتكرّرة التي يكن أن تعالج تعقيدات الكمية 
الهائلة من البيانات والاحتياجات المخصّصة للأعمال. 

- الجفاظ قدر الإمكان على بساطة تصميم النظام؛ لضمان اعتماد التقنية والنشاط التجاري. 

oS IL -‏ من توافق القرارات الفنية مع الرؤية الشاملة لتمكين سرعة الأعمال التجارية. 

- تطوير نهج (gel‏ لإدارة البيانات؛ لضمان سلامة البيانات التي dz‏ إلى ما بعد 
عملية التنفيذ؛ بحيث يفهم مستخدمو الأعمال والمستخدمون الفنيون كيفية تطبيق 
البيانات للتقارير والتحليلات. 

- تحديد مهلة للتأخير؛ لضمان 5$ حلول JS-‏ من مستودعات البيانات والتكامل- تدعم 
الاحتياجات. مما يعني ضمان أن Teradata SAP (jo‏ يدعم Ue]‏ احتياجاتهم التشغيلية. 

وتطيّق هذه الدروس المستفادة LAU‏ على نطاق أوسع واستخدام برنامج 
تحليلات تيراداتا لحلول SAP‏ وقد التزم صاحبٌ الشركة مركزية بنيته التحتية وإدارة 
علاماته التجارية بشكل أكثر فعالية. مما Sl‏ إلى الاستفادة من هذه الطريقة لجعل 
العملية تتم بطريقة أوتوماتيكية مع تقليل الوقت اللازم لإتمامها؛ بسبب القدرة على 
إرساء d>‏ مُستَهدّف لربط حلول تخطيط موارد المؤسسات لتحليلاتهم. 

أسئلة للمناقشة: 

-١‏ ما هي bial‏ التي واجهتها متاجرٌ التجزئة الهولندية الكبيرة؟ 

-Y‏ ما هو dol‏ المقترح متعدد الأطراف؟ وما هي التحَدِّيات التي واجهت التنفيذ؟ 

-Y‏ ما هي الدروس المستفادة؟ 


Source: Teradata case study. (2015). 800 percent: Use of Teradata? Analytics for 
SAP" Solutions accelerates Big Data delivery. assets.teradata.com/resourceCenter/ 


downloads/CaseStudies/EB8559 TAS Case Study.pdf?processed-1 (accessed July 
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2016); Enterprise Management, Teradata-SAP Solution to Big Data analytics. www. 
enterprisemanagement.com/research/asset.php/3047800-/Percent:-Use-of- Teradata- 


Analytics-for-SAP-Solutions-Accelerates- Big-Data-Delivery (accessed July 2016). 

ومن الواضح أن Laas‏ هدف العملء واجتماع المستخدمين النهائيين للإدارة على دعم 
المشروع, بالإضافة إلى تحديد EMI‏ الزمنية والميزانيات المعقولة:» وإدارة التوقعات» كلها أمورٌ 
بالغة الأهمية لنجاح مشروع مستودعات البيانات؛ إذ Ol‏ إستراتيجية مستودعات البيانات هي 
مخطط للتطبيق الناجح في إدخال مستودع البيانات. ويجب أن تقوم هذه الإستراتيجية Abg,‏ 
الأهداف التي تسعى الشركة إلى تحقيقهاء ولماذا تريدٌ تحقيق هذه الأهدافء وماذا ستفعل عندما 
تحقق هذه الأهداف. كما ينبغي أن تضع في اعتبارها رؤية المنظمة وهيكلها وثقافتها. ولمعرفة 
الخطوات التي OSE‏ أن تساعد في وَضْع إستراتيجية مرنة وفعّالة يمكنك الاطلاع على Matney,)‏ 
2003( عند e$‏ خطة ودعم مستودع البيانات؛ فإن المؤسسة تحتاج إلى بحث مُورّدي مستودع 
البيانات» (راجع الجدول Y-Y‏ للحصول على قائمة عينات من اممورّدينء ويمكنك Lá‏ مراجعة معهد 
مستودعات البيانات [twdi.org]‏ وبناة المعلومات .([informationbuilders.com]‏ كما ex‏ 

العديد من المورّدين برامج تجريبية لمستودعات البيانات الخاصة بهم ومنتجات ذكاء الأعمال. 


جدول Y-Y‏ قائمة عيّنات مودي مستودعات البيانات 
بائع عروض المنتجات 


مجموعة شاملة من برمجيات ذكاء الأعمال وبرامج 


كائنات الأعمال (businessobjects.com)‏ 
تصوير البيانات (المملوكة (SAP. te‏ 





مجموعة شاملة من أدوات ومنتجات مستودع 
البيانات (DW)‏ 


شركاء الحاسب (cai.com)‏ 





DW slof وإدارةء وثمرة‎ «eub 


مرآة البيانات (datamirror.com)‏ 





برنامج البيانات الوصفية 


مجموعة مزايا البيانات (dataadvantagegroup.com)‏ 





DW خوادم‎ 


Dell (dell.com) 





DW وثمرة أداء‎ lal s قسم»‎ 


Embarcadero (embarcadero.com) تقنيات‎ 





مزود حلول «oll‏ وموفر حلول البيانات (مملوك 
الآن من قبل (EMC‏ 


Greenplum (greenplum.com) 








84 وخدمات إدارة علاقات العملاء (CRM)‏ 





Harte-Hanks (harte-hanks.com) 
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بائع عروض المنتجات 





DW خوادم‎ HP (hp.com) 





Hummingbird Ltd. (hummingbird.com)‏ محركات DM‏ ومستودعات الاستكشاف 





مجموعة شاملة من أدوات» ومنتجات» وتطبيقات 


Hyperion (hyperion.com) حلول‎ 
DW 





IBM  InfoSphere (www-01.ibm.com/software/‏ | تكامل البيانات» «DM s‏ وإدارة البيانات الرئيسية, 
data/infosphere)‏ | ومنتجات البيانات الكبيرة 


























DW أداء‎ à وإدارةء ومر‎ sð Informatica (informatica.com) 
DW أدوات ومنتجات‎ (microsoft.com) مايكروسوفت‎ 

برنامج وموفر الأجهزة DW‏ (أجهزة (DW‏ (مملوكة 
Mb EN osi Netezza‏ 
Oracle‏ (وتشمل: (Siebel: oracle.com s PeopleSoft‏ أدوات ومنتجات وتطبيقات CRM; ERP; DW‏ 
معهد SAS (sas.com)‏ أدوات ومنتجات وتطبيقات DW‏ 
Siemens (siemens.com)‏ خوادم DW‏ 
Sybase (sybase.com)‏ مجموعة شاملة من أدوات وتطبيقات DW‏ 
تيراداتا (Teradata.com)‏ أدوات DW‏ وأجهزة DW‏ واستشارات وتطبيقات DW‏ 


مناهج تطوير مستودع البيانات: 
تحتاج العديدٌ من المؤسسات إلى إنشاء مستودعات البيانات المُستَخدّمة لدعم القرارء وهناك 

نهجان يستخدمان في هذا الغرضء وهما: 

- النهج الأول: وهو دهج ذكاء الأعمال ll Inmon‏ والذي يُطلّق عليه «أب (Father)‏ مستودعات 
البيانات»؛ إذ يؤيد Inmon‏ نهج التطوير من أعلى إلى أسفل والذي يتكيّف مع أدوات قاعدة 
البيانات التقليدية الارتباطية؛ وذلك لتلبية احتياجات تطوير مستودع البيانات على مستوى 
Lacus‏ ويُعرّف هذا النهج Uil‏ باسم نهج EDW‏ 

- النهج الثاني: هو Ralph Kimball g4‏ والذي اقترح نهجًا تصاعديًا من القاعدة إلى القمة؛ إذ 
يستخدم نمذجة الأبعادء ويُعرف هذا النهج Ul‏ باسم نهج DM‏ 
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Ol‏ معرفة أوجه التشابه والاختلاف بين هذين النهجين يساعدنا على قَهُمِ مفاهيم مستودع 
البيانات الأساسية (وللمزيد انظر: 2004 (Breslin,‏ وفيما (Jo‏ جدول Y-Y‏ والذي يقارن بين 
هذين النهجين» eds‏ وصقًا تفصيليًا لهما: 


جدول Y-Y‏ التباين بين نهجي التطوير EDWs DM‏ 


















































الجهود DM gy‏ نهج EDW‏ 
الإطار المجال موضوع واحد ا مجالات عدة مواضيع 
وقت التطوير شهور سنة 
تكلفة التطوير ۰۰۰۰ دولار إلى ٠٠١٠٠١‏ دولار erg b‏ 
صعوبة التطوير منخفضة إلى متوسطة عالية 
المتطلبات المسبقة لتبادل 
عام (داخل منطقة العمل) عام ae)‏ اللؤسسة) 
البيانات 
المصادر فقط بعض الأنظمة التشغيلية والخارجية | العديد من الأنظمة التشغيلية والخارجية 
الأحجام ميجابايتس إلى عدة جيجابايتس جيجابايتس إلى بيتابايتس 
أفق زمني بالقرب من البيانات الحالية والتاريخية | البيانات التاريخية 
تحويلات البيانات منخفض إلى متوسط متوسط 
تحديث التردد كل ساعة» oss‏ أسبوعيًا esa‏ شهريًا 
التقنية 
المعدات محطات العمل والخوادم والإدارات خوادم المؤسسة وأجهزة الحاسب المركزية 
نظام التشغيل ويندوز ولينكس يونيكسء 05/390 ,2/05 
1 مجموعة العمل أو خوادم قاعدة البيانات 1 8 
قواعد البيانات x‏ خوادم قواعد بيانات المؤسسة 
القياسية 
الاستعمال 
عدد المستخدمين المتزامنين 10s‏ من 1005 إلى 1000s‏ 
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الجهود نهج DM‏ | نهج EDW‏ 
أنواع امستخدمين محللي منطقة الأعمال والمديرين | محللي الشركات وكبار المديرين التنفيذين 
إلقاء الضوء على الأعمال تحسين الأنشطة داخل مجال الأعمال | التحسين الانسيابي واتخاذ القرارات 




















المصادر: مقتبس من )2003( .Van den Hoven, J.‏ بيانات المخططات: خطة كبيرةء وبناء صغير. كتيب في إدارة 18ء 

«CRC Press. Ariyachandra, T., & Watson, 11.2 الطبعة الثامنة« بوكا راتو« فلورايد!:‎ 

- نموذج INMON‏ (طريقة XEDW‏ ویرگز & Inmon‏ على التطوير من القمة إلى القاعدة 
باستخدام منهجيات وأدوات تطوير قاعدة بيانات dub‏ مثل: الرسوم البيانية للعلاقات بين 


2 
ور 


الكيانات (ERD)‏ وتعديل نهج التطوير الحلزوني. ولا gie‏ نهج EDW‏ إنشاء Axis DMs‏ 
DMW‏ نظاماً مثاليًا في هذا النهج؛ لأنه يوفر وجهة نظر متسقة وشاملة للمؤسسةء وقد قدم 
Murtaza (1998)‏ إطار عمل لتطوير EDW‏ 

- نموذج Ó) KIMBALL‏ نموذج إستراتيجية Kimball J DM‏ هو «خطة كبيرة tbug‏ صغير». و 
DM‏ هو مستودع البيانات الموجّهة با موضوع أو اللوجَّهة بحسب القسم. فهو نسخة Bias‏ 
من مستودع البيانات الذي يركز على طلبات قسم معينء مثل: التسويق أو المبيعات. ويطبّق 
هذا النموذج نمذجة بيانات الأبعاد والتي تبدأ بالجداول. وقد دعا Kimball‏ إلى منهجية 
تطوير تستلزم اتباع نهج gusla‏ (من القاعدة إلى القمة)ء وهو ما يعني في حالة مخازن 
البيانات بناء DM‏ واحد في JS‏ مرة. 


ما هو النموذج الأفضل؟ 

لا تُوجّد إستراتيجية واحدة تناسب الجميع لمستودعات البيانات. فمن الممكن أن تتطوّر 
إستراتيجية تخزين بيانات المؤسسة من DM‏ بسيط إلى مستودع بيانات ai‏ استجابة لمطالب 
المستخدمين» ومتطلبات أعمال المؤسسة: ونضج المؤسسة في إدارة موارد البيانات الخاصة بها. 
وبالنسبة للعديد من الشركات؛ فإن نموذج DM‏ في كثيرٍ من الأحيان هو خطوة أولى مريحة 
لاكنساب الخبرة في بناء وإدارة مستودع بيانات في أثناء عرض مُستخدمي الأعمال بالإضافة إلى 
فوائد الوصول بطريقة أفضل إلى بياناتهم» وتشير علامة Šole DM‏ إلى قيمة الأعمال الخاصة 
بمستودعات البيانات. وف النهاية؛ 385 هندسة EDW‏ والتي تدمج DMS‏ القدهة ومستودعات 
البيانات هي الحل المثالي (انظر: الحالة العملية (E-Y‏ ومع ذلك؛ OB‏ تطوير نماذج DMs‏ الفردية 
يمكنها أن توفر فوائد عديدة في طريقها نحو تطوير ol EDW‏ إذا كانت المؤسسة غير قادرة 
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أو ليس لديها رغبة في الاستثمار في مشروع على نطاق واسع. كما يمكن أن تظهر دلائل جدوى 
ونجاح نموذج DMs‏ في تقديم المزايا. وقد يؤدي ذلك إلى استثمار في gai. EDW‏ الجدول 
eal ٤-۳‏ الاختلافات المميزة بين النموذجين. 


جدول :£-Y'‏ الفروق الأساسية بين نهجي Kimball Inmon‏ 

















الصفة المميّزة Kimball Inmon‏ 
المنهجية وأسلوب البناء 
النهج العام من أعلى إلى أسفل (تنازلي) من أسفل إلى أعلى (تصاعدي) 
مستودع بيانات «يغذي» قواعد | موذج DMs‏ عملية تجارية واحدة 
هيكل البناء البيانات الإدارية على مستوى المؤسسة | ويتحقق الاتساق المؤسسي؛ من خلال 
(صغير) ناقل البيانات ومطابقة الأبعاد 
تعقد الأسلوب معقدة جدًا بسيطة إلى i5‏ كبير 
مقارنة E n‏ عملية من أربع خطوات؛ خروجًا عن 
ارنة مع منهجيات شتقة من المنهجية الحلزونية ية من أربع خطوات؛ خروجًا عن 


RDBMS أساليب‎ 











AI التنمية‎ 



































مناقشة التصميم gW‏ | دقيق إلى حَدَّ ما as bna‏ 
نمذجة البيانات 
اتجاه البيانات موضوع. أو بيانات مستندة عملية موجهة 
تقليدية ( بيانية لعلاقة الكيان 8 
api; ٠ et: ,‏ الأبعاده خروجًا عن النمذجة 
الأدوات [ERD]‏ ورسوم بيانية لتدفق البيانات 
العلائقية 
([BDF]‏ 
إمكانية وصول المستخدم dli!‏ | منخفض متوسط 
الفلسفة 
الجمهور الرئيسي garnis‏ تقنية المعلومات المستخدمون النهائيون 
الموقع في المؤسسة جزء لا يتجزأ من قاعدة معلومات الشركات | محوّل وخادم البيانات التشغيلية 
v"‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 





Kimball Inmon الصفة المميّزة‎ 





nm 3 
يُسِهّل على المستخدمين النهائيين‎ dor تقديم‎ 
مباشر‎ Ki الاستعلام عن البيانات‎ 
والحصول عليها في أوقات استجابة معقولة‎ 
Sources: Adapted from Breslin, M. (2004, Winter). Data warehousing battle of the giants: Comparing the 


basics of Kimball and Inmon models. Business Intelligence Journal, 9(1), 6-20; Ariyachandra, T., & Watson, 
H. (2006b). Which data warehouse architecture is most successful? Business Intelligence Journal, 11(1). 


تقديم qi Jos‏ سليم ie‏ على 


59 ; 
موضوع أساليب وتقنيات قاعدة البيانات المجرّبة 

















اعتبارات إضافية لتطوير مستودع البيانات: 

تريد بعص ال منظمات الاستعانة مصادر خارجية بالكامل في جهود مستودعات البيانات؛ إذ إنهم 
لا يري دون اقتناء البرمجيات والأجهزة» كما أنهم لا يريدون التعامل مع إدارة نظم المعلومات الخاصة 
بهم» ولیس لديهم سوى بديل واحد وهو استخدام مستودعات البيانات المستضافة. وفي هذه الحالة؛ 
فإن الحل المثالي هو قيام شركة أخرى لديها ]5525 من الخبرة وامهارة» بتطوير مستودع البيانات 
والحفاظ عليه. غير f‏ هناك مخاوف تتعلق بالأمان والخصوصية مع استخدام هذا النهج (وللحصول 
على المزيد من التفاصيل راجع الرؤية الفنية HY.‏ 


تمثيل البيانات في مستودع البيانات: 

يُظهر Saa‏ مستودع البيانات النموذجي في الشكل ٤٠-١‏ إمكانية إجراء العديد من أشكال 
بنية مستودع البيانات (انظر: الشكل (A-Y‏ وبغض النظر عن البنية الهندسية؛ فقد كان تصميمٌ 
تمثيل البيانات في مستودع البيانات يعتمدٌ Glo‏ على مفهوم النمذجة البعدية. وتُعرّف النمذجة 
البعدية كنظام قائم على الاسترجاع يدعم وصول طلبات البحث ذات الحجم الكبير. ويجبٌ أن 
يتم تصميمٌ وتمثيل البيانات في مستودع ولكن Lél‏ 5525 معالجة الاستفسارات المعقدة المتعددة 
الأبعاد. وفي كثير من الأحيان؛ فإنَّ مخطط النجمة ومخطط snowflake‏ هما الوسيلة التي يتم 
بها is‏ النمذجة البعدية في مستودعات البيانات. 
نمذجة الأبعاد استخدامًا. ويحتوي مخطط النجوم على جدول حقائق مركزي مُحاط بعدَّة جداول 
أبعاد Latag‏ بها )2009 (Adamson,‏ ويحتوي جدول الحقائق على عدد je‏ من الصفوف التي 
تتوافق مع الحقائق المرئية والروابط الخارجية (أيْ: مفاتيح خارجية). ويحتوي جدول الحقائق 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yw‏ 


الفصل الثالث 


على السّمات الوصفية اللازمة لإجراء تحليل القرار وإعداد تقارير الاستعلام وينم استخدام ا مفاتيح 
الخارجية للارتباط بجداول الأبعاد. وتتكوّن سمات تحليل القرار من مقاييس الأداء والمقاييس 
التشغيليةء والمقاييس المجمّعة (مثل: حجم المبيعات, ومُعدّلات الاحتفاظ بالعملاء وهوامش الرّبح» 
وتكاليف الإنتاج» ومعدّل الخردة) وجميع المقاييس الأخرى اللازمة لتحليل أداء المنظمة. وبعبارة 
أخرى؛ OB‏ جدول الحقائق يتناول بشكل أساسيّ ما يدعم مستودع البيانات لتحليل القرارات. 

ol‏ جداول الحقائق المركزية المحيطة (والمرتبطة عبر المفاتيح الخارجية) هي جداول الأبعاد. 
وتحتوي جداول الأبعاد على تصنيف وتجميع المعلومات حول صفوف الحقائق المركزية. كما 
تحتوي على السّمات التي صف البيانات الموجودة داخل جدول الحقائق» وتتناول كيفية تحليل 
البيانات وتلخيصها. وإضافة إلى ذلك؛ فإنها تحتوي أيضًا على علاقة واحد - إلى - مُتعدّد في جدول 
الحقائق ا مركزيةء وعند استخدام الاستعلام يتح استخدامٌ الأبعاد لوضع القيم العددية في شرائح 
من ٠-١‏ في جدول الحقائق لتلبية الاحتياجات المتعَلّقة با معلومات. وقد تمّ تصميمٌ المخطط 
النجمي؛ بهدف توفير وقت الاستعلام والحصول على استجابة سريعة؛ ABUS]‏ إلى بساطته وسهولة 
صيانة هياكل قاعدة بيانات القراءة فقط. ويوضّح الشكل Ihh) -aY‏ نجمياً بسيطاً Ais‏ 
المخطط النجمي All‏ خاصةً لمخطط مجموعة الثلج (Snowflake)‏ 

وبالنسبة المخطط مجموعة الثلج (Snowflake)‏ فهو عبارة عن ترتيب منطقي للجداول في قاعدة 
بيانات مُتعدّدة الأبعاد؛ بحيث يشبه المخطط الارتباطي مجموعة الثلج في الشكلء ويرتبط مخطط 
مجموعة الثلج (Snowflake)‏ ارتباطًا Lis‏ بالمخطط النجمي عن طريق جداول حقائق مركزية 
(تكون واحدة فقط ole‏ والتي ترتبط بأبعاد متعددة. ومع ذلك ففي مخطط مجموعة الثلج 
ez (Snowflake)‏ تسوية الأبعاد إلى عدة جداول مرتبطة ببعضهاء في حين يتم تقوية أبعاد مخطط 
النجمةء مع تمثيل JS‏ بُعْد بجدول واحد. ويظهر مخطط مجموعة ثلج بسيط في الشكل 1٠١-87‏ 


مخطط كتلة الثلج مخطط النجمة 


l — mm zm | 
m وما‎ tm 



























































































































































شكل (a) :1١-8‏ مخطط النجمةء و(6) مخطط كتلة الثلج 


Y‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


رؤية فنية :V-Y‏ مستودعات البيانات المُستضّافة 

يحتوي مستودع البيانات المستضاف على نفس الوظيفةء إن لم يكن أكثر؛ فهو يعمل كمستودع 
بيانات في امموقع» غير أنه لا يستهلك موارد الحاسب في أماكن عمل العميل. PAR‏ مستودع 
البيانات المستضاف مزايا ذكاء الأعمال مطروحًا Laio‏ تكلفة تحديثات الحاسب» وتحديثات 
الشبكة, وتراخيص البرامج والتطوير الداخلي والدعم الداخلي والصيانة. 

edis‏ مستودع البيانات المستضاف المزايا التالية: 

- يتطلّب Sedi‏ الأدنى من الاستثمار في البنية التحتية. 

يُحرّر القدرة على الأنظمة الداخلية. 
5525 التدفق النقدي. 
pA -‏ حلولاً dish‏ بأسعار معقولة. 
o -‏ الحلول القوية التي تساعد على النمو. 
- يدم CIR‏ وبرامج ذات جودة أفضل. 
$y-‏ اتصالات أسرع. 
GŠ -‏ المستخدمين من الوصول إلى البيانات من المواقع البعيدة. 
- يسمح للشركة بالتركيز على الأعمال الأساسية. 
- يفي باحتياجات التخزين لأحجام كبيرة من البيانات. 

وعلى الرغم من مُميّزات مستودع البيانات المستضاف؛ OJ‏ ذلك لا يستلزم أن يكون مناسبًا 
لكل منظمة. فبعض الشركات الكبيرة التي تتجاوز عائداتها 0٠١‏ مليون دولار قد تخسر الأموال إذا 
كان لديها بالفعل بنيةٌ تحتيةٌ داخلية وموظفون في مجال تقنية المعلومات. bodeg‏ على ذلك؛ O‏ 
الشركات التي ترى أن التحؤل النموذجي يحدث عن طريق الاستعانة بمصادر خارجية في تطبيقات 
فقدان السيطرة على التحكّم في البيانات الخاصة بهم لا LAAS‏ استخدام pda‏ خدمة ذكاء الأعمال. 
وأخيرا؛ فإن أكثر الحجج شيوعًا والتي تعيق تطبيق مستودع البيانات المستضافةء هو أنه قد يكون 
من غير الحكمة الاستعانة مصادر خارجية للتطبيقات الحساسة لأسباب تتعلق بالأمان والخصوصية. 


*ok. 


تحليل البيانات في مستودع البيانات: 
3,244 تخزين البيانات بشكل مناسب à‏ مستودعات البيانات؟ يمكن استخدامها بطرق 
مختلفة لدعم القرارات التنظيمية. ids‏ القول بأن تقنية OLAP‏ هي تقنية تحليل البيانات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v‏ 


الفصل الثالث 


الأكثر استخدامًا في مستودعات البيانات» وقد تزايد الإقبال على هذه التقنية؛ بسبب الزيادة 
الهائلة في حجم البيانات والاعتراف بالأعمال القيّمة للتحليلات المبنية على البيانات. وببساطة؛ 
فإن OLAP‏ هو نهج للإجابة بسرعة عن الأسئلة المخصّصة عن طريق تنفيذ استفسارات تحليلية 
متعدّدة الأبعاد ضد مستودعات البيانات التنظيمية (أي: مستودعات (DMss OLLI‏ 


:OLTP مقابل‎ 42 


pihi a‏ مصطلح OLTP‏ (وهو نظام معالجة المعاملات عبر الإنترنت) في نظام ا معاملات 
المسئول بشكل أساسيّ عن DAN‏ وتخزين البيانات المتعلّقة بوظائف العمل اليوميةء مثل: ERP‏ 
.CRMs‏ و5030 POSs‏ وغيرها. ويتعامل نظام OLTP‏ مع احتياجات الأعمال الحساسة, وأداء 
معاملات الأعمال اليومية بطريقة أوتوماتيكيةء وتشغيل التقارير فوريًاء والتحليل الروتيني. غير 
Gl‏ هذه الأنظمة ليست مُصمّمة للتحليل yad‏ والاستفسارات المعقدة التي تتعامل مع عدد 
من عناصر البيانات. ومن ناحية أخرى؛ فقد تمّ تصميمٌ OLAP‏ بلعالجة هذه الحاجة؛ من خلال 
توفير Jalos‏ مُخصّصٍ للبيانات التنظيمية بشكل أكثر فعاليةٌ وكفاءةً. ويعتمد JS‏ من OLAP‏ و 
۶ بشکل کبیرٍ على بعضهما؛ إذ يستخدم OLAP‏ البيانات التي G3‏ التقاطها بواسطة OLTP‏ 
ويقوم ÉT OLTP‏ بإجراء عمليات الأعمال التي تتم إدارتها بواسطة القرارات التي يدعمها 
-OLAP‏ ويقدّم الجدول 0-8 dla‏ متعددة المعايير بين -OLAPs OLTP‏ 


جدول -0: مقارنة بين OLTP‏ و01۸۴ 





OLAP OLTP المعايير‎ 


e 1o e 23 7‏ القرار وتقديم إجابات 

iasi للقياه: مهاه العمل‎ pal 
لاستفسارات الأعمال والإدارة‎ i لغرض يام مهام‎ 
قاعدة بيانات المعاملات (مستودع‎ 


مصدر البيانات | بيانات عادي يركز بشكل أساسي على 


مستودع البيانات أو DM‏ (مستودع 
بيانات غير طبيعي يركز في المقام الأول 


الكفاءة والاتساق) على الدقة والاكتمال) 
L : 57 R‏ 2 أتقارير واستعلامات مُخصّصة ومتعددة 
التقارير تقارير دورية» وروتينية ومركزة بدقة 





الأبعاد ومركزة على نطاق واسع 
المعالجات. وقواعد البيانات المتخصّصة 


متطلبات المصدر | قواعد البيانات المترابطة (العلائقية) العادية 
s : ibd i ١‏ أذات السعة الكبيرة 














v.‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 





OLAP OLTP ا معابير‎ 





سريع (تسجيل المعاملات التجارية | بطيء (موارد مكثفة» ومعقدة. 
والتقارير الروتينية) واستعلامات واسعة النطاق) 














عمليات :OLAP‏ 
يعتمد الهيكلٌ التشغيلي الرئيسي في OLAP‏ على مفهوم GA a‏ المكعب. والمكعب في 
OLAP‏ هو عبارة عن بنية بيانات متعددة الأبعاد (فعلية أو افتراضية) والتي تسمح بتحليلٍ 
سريع للبيانات» كما يكن تعريف المكعب بأنه القدرة على معالجة البيانات وتحليلها بكفاءة 
من وجهات نظر odas‏ ويهدف ترتيب البيانات في مكعبات إلى cds‏ على القصور في قواعد 
البيانات المترابطة (العلائقية)؛ إذ 1 قواعد البيانات (المترابطة) العلائقية لا تناسب التحليل 
الفوري لكميات كبيرة من البيانات بشكلٍ جيد؛ بل إنها بدلا من ذلك تتيحٌ الفرصة للتلاعب 
بالسُّجلات (من خلال إضافة وحذف وتحديث البيانات) والتي تمثل سلسلةً من المعاملات. وعلى 
الرغم من وجود العديد من أدوات كتابة التقارير لقواعد البيانات العلائقية؛ OB‏ هذه الأدوات 

تكون بطيئة عند تنفيذ استعلام متعدد الأبعاد يشمل العديد من جداول قاعدة البيانات. 

وباستخدام GLE OLAP‏ للمحلّل التنقل عبر قاعدة البيانات والشاشة لمجموعة فرعية مُعيّنة 

من البيانات (وتطويرها بمرور الوقت) عن طريق تغيير اتجاهات البيانات وتعريف العمليات 

الحسابية. وتُسمّى هذه الأنواع من التنقلات التي يقوم lé‏ المستخدم من خلال تحديد شرائح (عن 

طريق التناوب) والتنقل لأسفل/ لأعلى xe)‏ التجميع والتصنيف) أحيانًا ب «شريحة ونرد» وتتضمّن 

عمليات OLAP‏ الشائعة الاستخدام شريحةً dos‏ والتنقيب لأسفلء ولفة المتابعة والمحور. 

- الشريحة: هي عبارة عن مجموعة فرعية من صفيف مُتعدّد الأبعاد ales)‏ تمثيل dS‏ الأبعاد)» 
هذه المجموعة تطابق Áa‏ واحدةً asd‏ واحد (أو أكثر) من الأبعاد غير الموجودة في المجموعة 
الفرعية. ويبَيّن الشكل VY‏ عملية تشريح بسيطة على مكعب ثلاني الأبعاد. 

- حجر التّرد: " هي عبارة عن شريحة على أكثر من بُعدّين من مكعب البيانات. 

- التنقل لأسفل/ لأعلى: التنقل لأسفل أو لأعلى هو تقنية Badas OLAP‏ إذ يتنقل المستخدم بين 
مستويات البيانات التي تتراوح من الأكثر Bleu!‏ (أعلى) إلى الأكثر تفصيلًا (أسفل). 

- لفة المتابعة: يتضمّن اللف إلى الأعلى حساب جميع علاقات البيانات لواحد أو أكثر من الأبعاد. 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۷1 


الفصل الثالث 


وللقيام بذلك؛ قد يتم تعريف علاقة حسابية أو صيغة. 
- المحور: ويُستَخدّم لتغيير اتجاه الأبعاد لتقرير أو عرض صفحة الاستعلام المخصّص. 


مكمب DOLAP‏ الأيعاداً 
























































شكل :1١-‏ عمليات تقطيع على مكعب بيانات بسيط ثلائي الأبعاد 
أسئلة مراجعة على القسم 5-7: 
-١‏ اذكر فوائد مستودعات البيانات. 
-Y‏ اذكر öte‏ معايير لاختيار gil‏ مستودع البيانات» واذكر سبب أهميتها. 
-Y‏ ما هو 01.48؟ وكيف يختلف عن SOLTP‏ 
-E‏ ما هو المكعب؟ وماذا يعني التنقل لأسفلء «alls‏ والشريحة. $jllg‏ 


V-Y‏ قضايا تنفيذ عملية مستودعات البيانات: 
dl‏ عملية مستودعات البيانات بشكل عام ellas‏ جهدًا Dla‏ يجب التخطيط له وتنفيذه 
وفقاً للأساليب المتّبعة. غير Of‏ دورة حياة المشروع لها 83e‏ جوانب ولا يمكن SS‏ شخصٍ أن يكون 
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s‏ في كل المجالات. ولذلك فنحن هنا sias‏ مناقشة أفكار وقضايا $23 لها صلة بعملية 
مستودعات البيانات. 
يرغبُ الناس في معرفة مدى نجاح مبادرات ذكاء الأعمال ومخازن البيانات الخاصة بهم مقارنةٌ 
بمبادرات الشركات الأخرى. وقد اقترح js‏ من (iv. -) Watson Ariyachandra‏ بعض معايير نجاح 
ذكاء الأعمال ونشاط مستودعات البيانات. كما ds e‏ من «Gonzalez; «Gerard g Watson‏ و 
Haywood‏ و(1999) Fenton‏ بالبحث في حالات فشل مستودع البيانات. وقد أظهرت نتائجهم 
أنَّ الناس يعرفون «الفشل» بطرق مختلفةء وهذا ما أده js‏ من Watson) s .Ariyachandra‏ 
200006 وقد قام معهدٌُ مستودعات البيانات (tdwi.org)‏ بتطوير go»‏ متکامل مستودعات 
البيانات تستطيع المؤسسة تطبيقه لقياس مدى تطوّرها. etig‏ النموذج وسيلةٌ سريعة 4 لقياس 
مدى صلاحية مكان مستودعات البيانات الخاصة بالمنظمة في الوقت الحاليء وكذلك الأماكن التي 
Goo‏ إلى الانتقال إليها فيما بعد. ويتكوّن £556 النضج من Cue‏ مراحل» وهي: مرحلة ما قبل 
BII‏ الرضاعة» الطفولة» المراهقة» البلوغ الحكمة. 
وترتفع 15 الأعمال مع PÄÄ‏ مستودع البيانات خلال JS‏ مرحلة من مراحل النجاح. us‏ تحديدٌُ 
المراحل من خلال عدد من الخصائصء Le‏ في ذلك النطاقء والهيكل التحليليء والتصورات التنفيذيةء وأنواع 
التحليلات, والإشراف» والتمويل» وبرنامج التقنية. وإدارة c i‏ والإدارة sejha‏ من التفاصيل انظر: 
.Watson(2009) s .Twogood ; .McGiverns .Hackathorns .Eckerson‏ و(2003) -Eckerson‏ 
تتسمٌ مشاريعٌ مستودع البيانات بالعديد من المخاطر. كما أن معظم هذه المخاطر موجودة 
lái‏ في مشاريع تقنية المعلومات الأخرىء ولكن مخاطر مستودعات البيانات أكثر خطورة؛ لأن 
مستودعات البيانات غالية الثمن وتتطلب الكثير من الوقت والموارد. ومشاريع واسعة النطاق. 
لذلك؛ فإن التطوير الناجح gogik‏ البيانات يتطلّب تقييم كل خطر في بداية المشروع. ومن 
all‏ التفكير بعناية في مختلف المخاطر, caia‏ المشكلات التالية: 
- الخطأ في اختيار eI‏ فأنت بحاجة إلى راع 1445 له نفودٌ على الموارد الضرورية لدعم واستثمار 
مخزن البيانات. كما أنك تحتاج él‏ إلى قائد تنفيذيّ للمشروع, ولا I‏ أن يكون هذا القائد شخصًا 
اكتسب احترام المسؤولين التنفيذيين الآخرين» ولديه شكوكٌ مقبولة حول التقنيةء كما أنه لا 3 أن 
يتصف بالحَزم مع المرونة. وإضافةً إلى ذلك؛ فإنك LA‏ تحتاج إلى مدير IS/IT‏ ليرأس المشروع. 
- تحديد توقعات يَصعُب الوفاء بها: أنت لا تريد إحباط المديرين التنفيذيين بإخبارهم بحقائق 
معينة. US‏ مشروع من مشاريع مستودعات البيانات يتكوّن من مرحلتين: 
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- المرحلة الأولى: هي مرحلة البيع؛ إذ تقوم بتسويق المشروع داخليًا عن طريق بيع الفوائد 
لَنْ يستطيعون الوصول إلى الموارد المطلوبة. 
- المرحلة الثانية: وتتمثل في الاجتهاد؛ من أجل الوفاء بتوقعات المرحلة الأولى» فبمجرد أن 
يكون لديك ما بين Y‏ و۷ ملايين دولار؛ Lal‏ نأمل أن تتمكّن من تحقيق ذلك. 

- الانخراط في اتباع نهج سلو غير جيد: ببساطة لا تقل بأن مستودعات البيانات ستساعد 
المديرين في اتخاذ قرارات أفضل؛ لأن ذلك ضمنياً يعني Bd‏ قراراتهم السابقة غير جيدة حتى 
الآن. ولكن قم بالترويج لفكرة أنهم سيكونون قادرين على الحصول على المعلومات التي 
يحتاجونها للمساعدة في aio‏ القرار. 

- تحميل Egiat!‏ با معلومات لمجرد توفرها: لا تجعل مستودع البيانات Sh‏ للبيانات؛ OS‏ 
هذا من شأنه أن يُبطئ استخدام النظام بغير داع. وهناك اتجاةٌ نحو الإحصاء والتحليل بشكلٍ 
فوري. ويجب إغلاق مستودعات البيانات في الوقت المناسب. 

- الاعتقاد أن تصميمَ قاعدة بيانات؛ من أجل مستودعات البيانات هو نفس تصميم قاعدة 
بيانات المعاملات: وبشکل عام؛ فإنه ليس كذلك. فالهدف من مستودعات البيانات هو 
الوصول إلى ا مجاميع بدلا من السجلات الفردية أو القليلة؛ كما هو الحال في أنظمة معالجة 
المعاملات. ويختلف المحتوى Lal‏ كما هو واضح في LAS‏ تنظيم البيانات؛ إذ تميل نُظم 
إدارة قواعد البيانات (DBMS)‏ إلى أن تكون غير مفرطة» وطبيعية» ومترابطة» في حين تكون 
مستودعات البيانات زائدة عن الحاجةء وليست طبيعيةء ومُتعدّدة الأبعاد. 

- اختيار مدير مستودع البيانات» والذي يكون aro‏ للتقنية Suo‏ من المستخدم: يتمثل أحد 
مفاتيح نجاح مستودع البيانات في فهم ضرورة حصول المستخدمين على احتياجاتهم» وليس 
التقنية المتقدّمة من أجل التقنية. 

- التركيرٌ على البيانات الداخلية التقليدية الموجّهة للسجلء وتجاهل قيمة البيانات الخارجية 
والنصوص والصورء ورا الصوت والفيديو: تأني البيانات بأشكال عديدةء ويجب أن تكون Šola‏ 
للأشخاص المناسبين في الوقت المناسب وبالشكل الصحيح. ويجبٌُ أن يتم فهرستها بشكل صحيح. 

- تقديم البيانات باستخدام تعريفات متداخلة ومذهلة: A‏ تطهيرٌ البيانات جانبًا مهمًا من 
مستودعات البيانات. ويشمل التوفيق بين تعريفات وتنسيقات البيانات المتعارضة على 
مستوى المنظمةء غير أنَّ ذلك قد يكون صعبًا من الناحية السياسية؛ نظرًا لأنه ينطوي Bale‏ على 
تغيير المستوى التنفيذي. 
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SLY -‏ بالقدرة على الوفاء بوعود الأداء» والقدرة والقابلية للتطوير: cellas‏ مستودعات البيانات 
بشكلٍ عام xS do pug au‏ مما هو مرصود في الميزانية. أيّ: التخطيط للمستقبل على نطاق واسع. 
- الاعتقاد أنَّ المشكلات قد انتهت عندما يكون مستودع البيانات holy‏ إذ تحتاج مشاريع /81 
5 إلى التطوير بشكلٍ مستمر. فكل تشر هو تكرار لعملية النماذج AIII‏ وسيكون هناك 
حاجةٌ دائمةٌ لإضافة المزيد من مجموعات البيانات المختلفة إلى مستودع البيانات؛ إضافةً إلى أدوات 
تحليلية إضافية للمجموعات الموجودة والإضافية من صُّنَاع القرارء كما يجب تخطيط الطاقة العالية 
والميزانيات السنوية؛ لأن النجاح يُولّد dolos‏ فبناء مستودعات البيانات عملية مستمرة. 
- التركيز على التنقيب في البيانات المخصّصةء وتقديم التقارير الدورية بدلا من التنبيهات: إن 
التطؤر الطبيعي للمعلومات في مستودع البيانات هو: )١(‏ التنقيب في البيانات من الأنظمة 
القدهةء وتطهيرهاء وتغذية المستودع بهاء (Y)‏ دعم التقارير المخصّصة حتى هكنك التعرّف على 
ما يريده الناس» (Y)‏ تحويل التقارير المخصّصة إلى تقارير مجدولة بانتظام. وهذه العملية 
لتمثلة في معرفة ما يريده الناس من أجل توفيره تبدو طبيعية؛ لكنها ليست الأمثل أو حتى 
عملية. فالمديرون مشغولون وهم في حاجة إلى الوقت لقراءة التقارير؛ ولذلك oj‏ أنظمة 
لتنبيه أفضل من أنظمة التقارير الدوريةء ويمكنها أن تجعل مهمة مستودع البيانات حاسمةٌ. 
وتقوم أنظمة التنبيه بمراقبة تدفق البيانات إلى المستودع وإبلاغ جميع الأشخاص الرئيسيين 
الذين يحتاجون إلى معرفة أي DÍS‏ مهم فور وقوعه. 
في العديد من المؤسسات,. لن يكون مستودع البيانات Ike‏ إلا إذا كان هناك دَعْمٌ قوي 
من الإدارة العليا من أجل تطويره. وإذا كان هناك بطل للمشروع ارتقى إلى أعلى في الهيكل 
التنظيمي. فعلى الرغم من أنَّ هذا الأمر من المحتمل أن يكون صحيحًا في (Sl‏ مشروع كبير لتقنية 
المعلومات؛ فإنه مهم بشكل gol‏ لتنفيذ مستودع البيانات. إذ يؤدي التنفيذ الناجح لمستودع 
البيانات إلى إنشاء هيكل إطار عمل قد يسمح بتحليل القرارات في جميع أنحاء المؤسسة. وفي 
بعض الحالات يوفر أيضًا SCM‏ شاملاً؛ وذلك من خلال منح الوصول إلى المعلومات الخاصة 
بعملاء ومورّدي المنظمة. وقد سهّل تنفيذٌ مستودعات البيانات المستندة إلى الويب (والتي تُسمّى 
أحيانا (Webhousing‏ الوصول إلى كميات هائلة من البيانات» ولكن من الصعب تحديد الفوائد 
الثابتة المرتبطة بمستودع البيانات. إذ يتم تعريف الفوائد الثابتة على أنها منافع للمنظمة التي 
يكن التعبيرٌ عنها من الناحية النقدية. ويُوجَّد لدى العديد من المنظمات موارد محدودة لتقنية 
المعلومات غير أن الأولوية يجب أن تُعطى للمشاريع. وقد يساعد الدعم الإداري والبطل القوي 
للمشروع في ضمان أن يتلقى مشروع مستودع البيانات ال موارد اللازمة للتنفيذ الناجح. كما أن موارد 
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مستودع البيانات قد تكون مكلفةً بشكل oS‏ وفي بعض الحالات تتطلب معالجات عالية الجودة 
وزيادات كبيرة في أجهزة تخزين الوصول المباشر. وقد تحتوي مستودعات البيانات المستندة إلى 
الويب tf‏ على متطلبات أمان خاصة؛ لضمان وصول المستخدمين ghabl‏ لهم فقط إلى البيانات. 
asd‏ مشاركة المستخدمين في تطوير البيانات ونماذج الوصول Yale‏ حاسمًا في نجاح تطوير 
مستودع البيانات؛ إذ إنه في أثناء نمذجة البيانات يكون عامل الخبرة مهما لتحديد البيانات 
المطلوبة» وتحديد قواعد العمل المرتبطة بالبيانات؛ إضافة إلى تحديد ا مجموعات والحسابات 
الأخرى التي قد تكون ضرورية. وهناك حاجة لنمذجة الوصول لتحديد كيفية استرجاع البيانات 
من مستودع البيانات» كما أنها تساعدٌ في التعريف المادي للمستودع من خلال اللمساعدة في 
تحديد البيانات التي تتطلب فهرسة. وقد تشير Lol‏ إلى ما إذا كانت DMs‏ التابعة مطلوبة 
لتسهيل استرجاع المعلومات. وإضافةً إلى ذلك؛ فإن هناك حاجة إلى مهارات فريق لتطوير وتنفيذ 
مستودع البيانات» ها في ذلك المعرفة المتعمّقة لتقنية قواعد البيانات وأدوات التطوير امُستَخدّمة. 
23s‏ ,^ أنظمة المصدر وتقنية التطوير - كما سبق أن ذكرنا - إلى العديد من المدخلات والعمليات 
الممستخدّمة لتنزيل وصيانة مستودع البيانات. وتمثل الحالة العملية ٤-۳‏ مثالا liao‏ على تطبيق 
واسع النطاق لمستودع بيانات متكامل من قبل حكومة الولاية. 
حالة عملية ٤-۳‏ 
EDW‏ يساعد على hij‏ وكالات الدولة في ولاية ميشغان 
تؤثر إدارة Michigan‏ للتقنية والإدارة والميزانية (DEMB)‏ على JS‏ مجالٍ من 
مجالات الحكومة؛ من خلال خدمة العملاء وتحسين ال موارد. والاستخدام المبتكر 
للمعلومات والتقنية» ويعتمد ما يقرب من ٠٠٠٠١‏ مستخدم في 0 أقسام رئيسة و٠٠‏ 
وكالة وأكثر من ٠‏ مكتب على PLAU EDW‏ بمهامّهم بشكل jS]‏ فاعلية وخدمة أفضل 
للمقيمين في .Michigan‏ ويحقق EDW‏ مليون دولار في يوم عمل في الفوائد اطالية. 
وقد ساعد EDW‏ ميشيغان في تحقيق فوائد مالية سنوية بقيمة ۲۰۰ مليون دولار 
ضمن قسم صحة المجتمع 0355 إضافةً إلى VO‏ مليون دولار أخرى في السنة ضمن دائرة 
الخدمات الإنسانية (DHS)‏ وتشمل هذه المدخرات فوائد سلامة البرنامج» وتفادي 
التكاليف؛ يسبب تحسّن النتائج» وتجنب العقوبات» والكفاءة التشغيلية» واسترداد 
المدفوعات غير الملائمة ضمن Medicaid gaby‏ الخاص بها. ys‏ مستودع البيانات 
5 في Michigan (DW)‏ معلومات فريدة ومبتكرة حاس مة لعمل الوكالة بكفاءة 
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من المستوى الإستراتيجي والتكتيكي. فعلى مدى السنوات العشر الماضية حققت شركة 
DW‏ نسبة فعالية التكلفة ea as ٠:1١‏ المعلومات abat)‏ من DW‏ الآن في جميع 
وظائف DHS‏ تقريبًاء ما في ذلك التسليم الدقيق والمحاسبة للفوائد المقدّمة مما يقرب 
من ۲,۵ مليون عميل من موظفي الذَّعم العام. 

وكانت sal Michigan‏ »4 في محاولاتها oJ‏ مشكلات الحياة الحقيقية من خلال 
المشاركة المبتكرة والتحليلات الشاملة للبيانات؛ إذ كان نهجها تجاه ls BI/DW‏ 
«مشروعًا» de)‏ مستوى الولاية) بطبيعته» بدلا من وجود منضّات منفصلة من BI/‏ 
JSI DW.‏ منطقة عمل أو وكالة حكومية. وقد استفادت Michigan‏ من كميات هائلة 
من البيانات لإنشاء أساليب مبتكرة لاستخدام BI/DW‏ وتقديم حلول مؤسسية تتسم 
بالكفاءة والمصدّاقية باستخدام قنوات متعددة؛ وذلك من خلال إزالة الحواجز التي 
تحول دون مشاركة بيانات المؤسسات عبر وحدات الأعمال. 

أسئلة للمناقشة: 

EDW Jia) تستثمر الدولة في بنية أساسية كبيرة ومُكلّفة لتقنية المعلومات‎ ISU -Y 

$Michigan من قبل وكالات الدولة في ولاية‎ Aso al EDW ما هو حجم وتعقيد‎ -Y 


TEDW الحصول عليها من‎ e ما ھی التحَدّيات وَالحَلٌ المقترح والنتائج التي‎ -Y 
Sources: Compiled from TDWI Best Practices Awards 2012 Winner, Enterprise 
Data Warehousing, Government and Non-Profit Category. Michigan Departments 
of Technology, Management & Budget (DTMB), Community Health (DCH), and 
Human Services (DHS). TDWI What Works, 34, 22; michigan.michigan.gov. 


مستودعات البيانات الضخمة وقابلية التطوير: 

يحتاج مستودعٌ البيانات إلى GES‏ قابلية التوسّح بالإضافة إلى ا مرونةء وتتمثل القضايا الرئيسية 
المتعلقة بقابلية التطوير فيما يلي: مقدار البيانات الموجودة في المستودع ومدى سرعة مو 
مستودع التخزين» وعدد المستخدمين المتزامنين» وتعقيد طلبات المستخدمين» كما يجب أن يتسع 
مستودع البيانات أفقيًا وعموديًا. وسوف ينمو ال مستودع كدالة لنمو البيانات والحاجة إلى توسيع 
المستودع لدعم وظائف الأعمال الجديدة. وقد يكون $2 البيانات ناتجًا عن إضافة بيانات الدورة 
الحالية (على سبيل المثال: نتائج هذا الشهر) أو البيانات السابقة. 
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وقد وَصَف هيكس (20-1) قواعد البيانات الضخمة ومخازن البيانات. وتقوم Walmart‏ 
باستمرار بزيادة حجم مستودع البيانات الضخم الخاص بها. ومن المعتقد أن Walmart‏ تستخدم 
مستودعًا يحتوي على مئات من terabytes‏ من البيانات لدراسة اتجاهات المبيعات, وتتبّع المخزون» 
وتنفيذ مهامً أخرى. وقد قامت IBM‏ مؤخرًا بنشر مؤشرها الخاص بالمستودع الذي يبلغ 0٠‏ 
تيرابايت )2009 (IBM:‏ الجديرٌ بالذكر أن وزارة الدفاع الأمريكية تستخدم مستودعًا للبيانات 
يبلغ 0 بيتابايت لحفظ السجلات الطبية لعدد ‏ ملايين من الأفراد العسكريين. كما أن CNN‏ 
أيضًا لديها مستودع بيانات بحجم cPetabyte‏ وذلك KE‏ للتخزين المطلوب لأرشفة لقطات الأخبار. 

وبالنظر إلى Ol‏ حجم مستودعات البيانات يتوسّع معدل std‏ فإن القابلية للتطوير هي قضية 
مهمة. Lag‏ بقابلية التوسّع الجيد أن الاستعلامات ووظائف الوصول إلى البيانات الأخرى 
ستنمو (بشکل مثالي) خطيًا مع حجم حجم المستودع. انظر: )2006( sil Rosenberg‏ على طرق 
تحسين أداء الاستعلام. وفي الممارسة asl‏ تم م تطويرٌ أساليب مُتخصّصة لإنشاء مستودعات 
بيانات قابلة للتطوير غير أنَّ قابلية التوسّع صعبة عند إدارة مئات terabytes‏ أو أكثر. فبيانات 
بحجم terabytes‏ تحتوي على قدرٍ كبير من القصور الذاتي» وتحتلٌ الكثير من المساحة «dial‏ 

كما أنها تتطلّب أجهزة حاسب قوية. وتستخدم بعض الشركات المعالجة المتوازية لإدارة بياناتهم» 
في حين يستخدم ex Ji‏ الآخر الفهرسة الذكية وخطط البحث. كما يقوم البعض بنشر بياناتهم 
عبر مخازن البيانات الفعلية المختلفة. ومع اقتراب المزيد من مستودعات البيانات من حجم 
petabyte‏ يستمرٌ تطوير حلول أفضل وأحسن لقابلية التوسع. 

وقد عالج )2002( Hall‏ أيضًا قضايا قابلية التطوير iy‏ شركة AT&T‏ شركةً رائدةً في مجال 
نشر واستخدام مستودعات البيانات الضخمة؛ وقد استطاعت AT&T‏ اكتشاف الاحتيالية لاستخدام 
بطاقات الاتصال والتحقيق في المكالمات المتعلقة بعمليات الخطف والجرائم الأخرى؛ وذلك بفضل 
مستودع البيانات الذي تبلغ سعته 71 تيرابايت. كما أنها استخدمت القدرة على حساب ملايين 
أصوات الاتصال من مشاهدي التلفزيون الذين يختارون بطل برنامج Jil American Idol‏ - 
وللحصول على عيّنة من تطبيقات مستودعات البيانات الناجحة: انظر: )2003( .Edwards‏ وقد 
درس Lang (2004) Jukic‏ الاتجاهات والقضايا المحدّدة المتعلقة باستخدام الموارد الخارجية في 
تطوير ودَعُم مستودعات البيانات وتطبيقات ذكاء Jles‏ كما أشار )2003( Davison‏ إلى أن 
الاستعانة مصادر خارجية في مجال تقنية المعلومات كانت تتزايد معدل ۲١‏ إلى disg degna 4۲١‏ 
النظر في نقل مشاريع مستودعات البيانات إلى الخارج؛ يجب النظر بعناية إلى الثقافة والأمن 
(وطزيد من التفاصيل انظر: 2004 -Jukic & Lang,‏ 


YVA‏ ذكاء الأعمال والتحليلات وعلم «LI‏ منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


أسئلة مراجعة على القسم V-V‏ 

-١‏ ما هي مهام تنفيذ DW‏ الرئيسية التي يمكن تنفيذها بالتوازي؟ 

DW اذكر مع الشرح المبادئ التوجيهية الأكثر دقة في تنفيذ‎ -Y 

-Y‏ ما هي eal‏ ا مخاطر والقضايا التي يجب مراعاتهاء ورها تجنبها عند تطوير مستودع بيانات ناجح؟ 
-E‏ ما هي القابلية للتطوير؟ وكيف تطبّق على SDW‏ 


۸-۳ إدارة مستودع البيانات» والمشكلات الأمنيةء والاتجاهات المستقبلية: 
توفّر مستودعات البيانات $55 تنافسيةٌ متميزةً للمؤسسات التي تنش ئها وتستخدمها 
بفاعلية. ونظرًا لحجمها الكبير وطبيعتها الجوهرية؛ DB‏ مستودع البيانات يتطلب مراقبةً قويةٌ 
بشكلٍ خاصٌ؛ للحفاظ على JS‏ من الكفاءة والإنتاجية المرضيتين. وتنطوي الإدارة الناجحة وإدارة 
مستودع البيانات على المهارات والكفاءة التي تتجاوز ما هو مطلوب من مسؤول قاعدة البيانات 
التقليدي (DBA)‏ ويجب أن يكون مسؤول مستودع البيانات (DWA)‏ متوافقاً مع تقنيات 
البرامج العالية الأداء والأجهزة والشبكات. كما يجب Lio‏ أن يمتلك رؤية أعمال رائعة. وما 
كانت مستودعات البيانات gis‏ أنظمة ذكاء الأعمال و088 والتي تساعد المديرين في اتخاذ 
قرارتهم» وَجَبَ على مسؤول مستودع البيانات أن يكون على دراية بعمليات اتخاذ القرار لتصميم 
هيكل مستودع البيانات وصيانته بشكلٍ مناسب. ومن Gall‏ بشكل خاص أن يحافظ DWA‏ على 
المتطلبات والإمكانات الحالية مستودع البيانات؛ في حين يوفر في الوقت نفسه مرونةٌ للتحسينات 
السريعة. dado‏ يجب أن تمتلك DWA‏ مهارات اتصال ممتازة. وللحصول على وَصْف للاختلافات 
الأساسية بين DBA‏ و2184 انظر: .Fadlallas -Benanders .Benander‏ و(2000) James‏ 
dad‏ أمان ا معلومات وخصوصيتها من الاهتمامات الرئيسة والمهمة بالنسبة لمُستخدمي مستودع 
البيانات. وقد أصدرت الحكومة الأمريكية لوائح (على سبيل المثال: قواعد الخصوصية والضمان ل 
Gramm-Leach-Bliley‏ والتأمين الصحي وقانون المساءلة لعام ([HIPAA] ٠۹۹٩‏ ووضعت 
متطلباتٍ إلزامية في إدارة معلومات العملاء. وبالتالي؛ يجب على الشركات إنشاء إجراءات أمنية Jis‏ 
ولكنها مرنة في الوقت ذاته لتتوافق مع العديد من أنظمة الخصوصية. ووفقًا لما ذكره jS‏ من Elson‏ 
و(2005) LeClerc‏ فإنه يجب أن يركز الأمان الفعّال في مستودع البيانات على أربعة مجالات رئيسية: 
-١‏ وضع سياسات وإجراءات أمنية فعّالة للشركات. ويجب أن تبدأ السياسة الأمنية الفعّالة من 
الإدارة التنفيذية العلياء وينبغي EU)‏ جميع الأفراد داخل ابلؤسسة. 
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-Y‏ تنفيذ إجراءات وتقنيات أمنية منطقية لتقييد الوصول. وتتضمّن هذه الإجراءات التحقق من 
المستخدم: وعناصر التحكم في الوصولء وتقنية التشفير. 

-Y‏ تقييد حرية الوصول إلى محيط مركز البيانات. 

£- إنشاء عملية مراجعة Iki‏ للرّقابة الداخلية مع التركيز على الأمن والخصوصية. 

وسوف يتم تحديدٌ تطورات مستودعات البيانات على المدى القريب؛ وذلك من خلال عوامل 

ملحوظة (مثل: حجم البيانات» وزيادة درجة التأهب لوقت الاستجابةء وتنوع وتعقيد أنواع 

البيانات) وعوامل أخرى أقل وضوحًا (مثل: متطلبات المستخدم lal‏ التي م تستوف البيانات» 

وبطاقات الأداء المتوازن» وإدارة البيانات الرئيسيةء وجودة المعلومات). وفي e‏ هذه العوامل 

aS ed‏ اقترح js‏ من )2009( Moseley‏ و )2006( 8 كأن تعتمد اتجاهات مستودعات 

البيانات على البساطة, والقيمة. والأداء. 





مستقبل مستودعات البيانات: 

لقد كان Jlo‏ مستودعات البيانات مجالا حيويًا في مجال تقنية المعلومات في العقدين 
الأخيرينء وتبرهن الأدلة في عام 81/84 والبيانات الضخمة أن أهمية المجال سوف alaj‏ فقط 
حتى تصبح أكثر إثارة للاهتمام. وفيما ياي بعض المفاهيم والتقنيات التي ظهرت مؤخرًا والتي 
ستلعب go‏ مهما في تحديد مستقبل مستودعات البيانات. 


الاستعانة بمصادر مختلفة (آليات للحصول على البيانات من مصادر متنوعة ومتفرقة): 

- شبكة الإنترنت» ووسائل التواصل الاجتماعيء والبيانات الضخمة: إن الطفرة الأخيرة في استخدام 
شبكة الإنترنت لأغراض شخصية إضافةً إلى الأعمال التجاريةء إلى جانب الاهتمام الكبير بوسائل 
التواصل الاجتماعي يوفر فرصًا للمُحللين للاستفادة من مصادر بيانات غنية dr‏ وبسبب 
الحجم الهائل والسرعة وتنؤع البيانات؛ فقد ظهر مصطلحٌ جديدٌ لتسمية هذه الظاهرة. وهو 
مصطلح: «البيانات الضخمة». وللاستفادة من البيانات الضخمة؛ فإن الأمر يتطلب تطوير 
تقنيات 81/84 الجديدة وا محسّنة؛ مما سيؤدي إلى ثورة في ble‏ مستودعات البيانات. 


Sources: Compiled from Thornton, M., & Lampa, M. (2002). Hosted data warehouse. Journal of Data 
Warehousing, 7(2), 27-34; Thornton, M. (2002, March 18). What about security? The most common, but 


unwarranted, objection to hosted data warehouses. DM Review, 12(3), 30-43. 
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التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


- برمجيات مفتوحة المصدر: يتزايدٌ استخدام أدوات البرمجيات مفتوحة المصدر إلى مستوى 
غير مسبوق في التخزينء وذكاء الأعمالء وتكامل البيانات. وهناك أسباب وجيهة للزيادة في 
البرمجيات المفتوحة المصدر المُستَخدّمة في مستودعات البيانات )2009 (Russom,‏ وهي: 
si -Y‏ الركود إلى زيادة الاهتمام بالبرامج المفتوحة المصدر المنخفضة التكلفة. 
-Y‏ وصلت الأدوات مفتوحة المصدر إلى مستوى أعلى في النضج. 
-Y‏ تقوم البرمجيات مفتوحة المصدر بتقوية برامج المشاريع التقليدية دون استبدالها. 

SaaS -‏ (كخدمة برمجية). «نموذج ASP‏ الموسّع»: 53 1 SaaS‏ طريقة مبتكرةً لنشر 
تطبيقات أنظمة المعلومات؛ إذ يقوم ógh‏ الخدمة gig‏ العملاء ترخيصاً لاستخدام 
تطبيقاته عند الطلب لاستخدام تطبيقاته كخدمة عند الطلب (وعادةً ما يكون ذلك عبر 
الإنترنت). وتمكن gg‏ برامج SaaS‏ استضافة التطبيق على الخوادم الخاصة بهم أو 
تنزيل التطبيق إلى موقع المستهلك. والمضمون أن SaaS‏ هي النسخة الجديدة والمحسّنة 
من نموذج ASP‏ وبالنسبة لعملاء مستودع البيانات؛ فإن العثور على تطبيقات وموارد 
البرمجيات القائمة على SaaS‏ والتي ib‏ الاحتياجات والمتطلبات الخاصة من الممكن 
أن يكون أمرًا صعبًا. ونظرًا OÙ‏ عروض هذه البرامج أصبحت أكثر مرونةٌ؛ فإن الاستعانة 
ب SaaS‏ والاستخدام الفعلي لها كخيار لمنضّة مستودعات البيانات سوف يزداد أيضًا. 

- حوسبة سحابية: رها تكون الحوسبة ZU‏ حابية هي الخيارٌ الأحدث والأكثر إبداعًا في النظام 
الأماسي الذي سيأتي على مدار سنوات؛ إذ يتم تجميعٌ العديد من موارد الأجهزة والبرمجيات 
الافتراضية؛ بحيث يمكن تخصيصها بحرية للتطبيقات ومنصات البرامج عند الحاجة إلى الموارد. 
مما يتيح لتطبيقات أنظمة المعلومات أن ترتفع ديناميكيًا مع زيادة أعباء العمل. وعلى الرغم 
من أن تقنيات الحوسبة السحابية والتقنيات الظاهرية المشابهة معروفة جيدًا للتطبيقات 
التشغيلية اليوم؛ فإنها بدأت الآن في استخدامها كبرامج مستودع بيانات مختارة. فالتخصيص 
الفعّال لس حابة يكون مفيداً Yis‏ خاص عندما يختلف حجم مستودع البيانات بشكلٍ غير 
متوقع؛ مما يجعل تخطيط السّعة Ao Dal‏ 1 

- بحيرات البيانات: مع ظهور البيانات الضخمة ظهر برنامج بيانات جديد يُسِمّى: بحيرة OLLI‏ 
وهو عبارة عن موقع تخزين كبير يمكنه الاحتفاظ بكميات هائلة من البيانات (والتي غالبًا ما 
تكون غير مهيكلة) في نَسَقها الأصلي/ الخام لاستهلاك التحليلات المستقبلية/ المحتملة. فبينما 
يقوم مستودعٌ البيانات مستودعات البيانات المنظمة؛ فإن بحيرة البيانات 0523 جميع أنواع 
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البيانات. في حين أن كليهما عبارة عن آليات لمستودعات البيانات؛ فمستودع البيانات يتمحور 
حول البيانات المنظمة/ المجدولة» Ul‏ بحيرة البيانات تناسب جميع أنواع البيانات. des‏ الرغم 
من كثرة ما قبل وكتب عن العلاقة بين الاثنين (بعض هذه الكتابات» وبعض ما قيل يوحي ob‏ 
بحيرة البياناتء هي الاسم المستقبلي لمس تودعات البيانات) ÖB‏ بحيرة البيانات ليست بدلا 
ممستودع البيانات؛ بل يُكمّل US‏ منهما الآخر. وفيما يلي الفكرة التطبيقية Y-Y‏ والتي X9‏ من 
خلالها على شرح بحيرات البيانات ودورها في مجال مستودعات البيانات والتحليلات التجارية. 


رؤية فنية :٠-۲‏ بحيرات البيانات: 


مع ظهور ظاهرة البيانات الكبيرة؛ jab‏ مصطلحٌ جديدٌ وهو «بحيرة البيانات». ويعتقد 
الكثيرون أن بحيرة البيانات هي نفسها مستودع البيانات القديم؛ ولكن بشرط أن يكون 
جيدًا. ويشير الافتراض الأساسي إلى أن الطريقة القدهة المستودعات البيانات لا تناسب 
(أولا تكفي) في عصر البيانات الكبيرة» وبالتالي؛ فإن هناك حاجةً إلى طريقة جديدة لتخزين/ إدارة 
البيانات؛ مما ag‏ الطريق لبحيرات البيانات. وعلى الرغم من أن معظمهم يعتقدون أن بحيرة 
البيانات هي الطريقة «JE‏ وأنها جاهزة لعمل قفزة كبيرة في مجال مستودعات البيانات؛ ÓB‏ 
البعض الآخر له تحفُظات على استخدامها Less)‏ شك في جدواها). واصفاً lal]‏ بأنها مستنقع. 


dS]‏ ما هي dide‏ بحيرة البيانات؟ 

Ól‏ بحيرة البيانات ببساطة هي موقعٌ تخزين mS‏ يمكنه الاحتفاظ بكميات هائلة من البيانات 
(مهيكلة أو غير مهيكلة أو شبه مهيكلة) بتنسيقها الأصلي/ الخام للاستخدام المستقبلي المحتمل. في 
حين أن مستودع البيانات لا 553 إلا البيانات المنظمة في الجداول أو الملفات أو مجلدات» كما أن 
بحيرة البيانات تستخدم dus‏ غير مُحدّدة ا معام GI)‏ غير مهيكلة) لتخزين جميع أنواع البيانات. 
وتتمثل القواسم المشتركة الرئيسية بين بحيرة البيانات ومستودع البيانات في Ol‏ كلا منهما Jai‏ آليات 
لمستودعات البيانات» وعلى العكس؛ فإن الاختلاف الرئيسي هو أن مستودع البيانات giin‏ بالبيانات 
المنظمة / المجدولة. في حين أن بحيرة البيانات تتعلق بجميع أنواع البيانات (مثل: البيانات الكبيرة). 

على الرّغم من أن تعريف بحيرة البيانات يتغيّر بين علماء البيانات؛ ÓH‏ التعريف الأكثر 
استخدامًا هو تعريف James Dixon‏ مؤسس شركة Pentaho‏ و010). والذي ارتبط اسمه 
بمصطلح بحيرة البيانات. وفيما يلي الطريقة التي يَصف بها )2010 (Dixon,‏ بحيرة البيانات؛ 
إذ يقول: إذا كنت تفكر في سوق البيانات كمخزن للمياه المعبأة - من حيث تنظيفها وتعبئتها 
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التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


وتنظيمها لسهولة الاستهلاك - OB‏ بحيرة البيانات عبارة عن مجموعة كبيرة من المياه في حالة 
طبيعية» وتدفق إليها المحتويات من أحد المصادر بملء البحيرة وفي هذه الحالة يمكن لمستخدمي 
لبحيرة المتنوعين أن dogani‏ أو يغوصوا فيهاء أو حتى يأخذوا عينات منها. 

ولعلٌ أفضل طريقة لتوصيف بحيرة البيانات؛ هي مقارنتها بمستودع بيانات في جدول مُتعدّد 
الأبعاد. وفيما يلي الجدول (-1) وهو عبارة عن جدول ملخص (يتبعه وصفٌ 3:55( للأبعاد ASSI‏ 
شيوعًا لعمل مقارنة بين بحيرة البيانات ومستودع البيانات )2015 -(Dull, 2016; Campbell,‏ 


جدول T-V‏ مقارنة بسيطة بين مستودع البيانات وبحيرة البيانات 

















البعد مستودع البيانات بحيرة البيانات 
طبيعة البيانات منظمة ومعالجة أي بيانات أصلية / أولية 
المعالجة مُخطط على الكتابة (SQL)‏ | تصميم 
سرعة الاسترجاع سريع fas‏ المخطط على القراءة (NoSQL)‏ 
حجم التكلفة مكلفة للبيانات الكبيرة بطيئة مُصمّمة للتكلفة ا منخفضة 
المرونة أقل مرونةًء والتكوين ثابت | التخزين Gy‏ للغاية والتكوين مرن 
الحداثة/ الخبرة ليس جديداً/ ناضج جديد جداً/ ناضج 
الأمان EC gól‏ لم oal‏ جيداً بعد 
ا مستخدمون مُحترفو الأعمال علماء البيانات 





طبيعة البيانات: يقوم مستودع البيانات بمستودعات البيانات التي تم تصميمها/ تجميعها/ 
هيكلتها فق ط؛ في حين ol‏ بحيرة البيانات تقوم بتخزين كافة أنواع البيانات المهيكلة, وشبه 
ا مهيكلة؛ إضافةٌ إلى غير المهيكلة بتنسيقها الأصلي/ الأوَّلي. 

المعالجة: قبل تنزيل البيانات في مستودع البيانات؛ نحتاجٌ Sol‏ إلى إعطائها شكلا Maas‏ 
أيْ: Lil‏ نحتاجُ إلى m$‏ نموذج لها في المخطط ail‏ أو مخطط مجموعة الثلج وهو ما يُسمّى 
مخطط الكتابة. GÍ‏ مع بحيرة البيانات؛ فإننا نقوم فقط بتنزيل البيانات الأوليةء كما «ut‏ وعندما 
نكون مستعدين لاستخدام البيانات؛ فإننا نعطيها شكلًا أو تصميمًاء وهو ما يُطلّق عليه مخطط 
القراءة. وهما طريقتان مختلفتان للغاية في المعالجة. 
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سرعة الاسترجاع: لأكثر من عقدين وهناك تطويرٌ مستمرٌ للعديد من القواعد الحسابية 
لتحسين سرعة استرجاع البيانات من مستودعات البيانات التي تتميّز بأنها مليئة وكبيرة. وتشمل 
هذه التقنيات ا مشغلات, والتمثيل العمودي للبيانات» ومعالجة قواعد البيانات. وحتى الآن؛ ÓE‏ 
عملية استرجاع البيانات (التي OSE‏ أن تكون ib‏ شكلٍ أو أسلوبء ها في ذلك pal‏ غير المنظم) 
Élis i$‏ يتطلب Ég‏ كبيرا. 

تكلفة التخزين: Aa‏ إحدى الزات الرئيسة لتقنيات البيانات الكبيرة مثل Hadoop‏ هي أن 
تكلفة مستودعات البيانات منخفضة Guus‏ مقارنةً مستودع البيانات» وهناك سببان رئيسان لذلك: 
- السبب الأول: Hadoop‏ وهو Gab p‏ مفتوح المصدر؛ ولذلك فإن الترخيص ودَغْم المجتمع مجاني. 
- السبب الثاني: أنه 3( تصميمٌ Hadoop‏ بحيث e‏ تثبيته على أجهزة السَّلع المنخفضة التكلفة. 

المرونة: بالتعريف يُعَنُ مستودع البيانات مستودعًا Blaio‏ للغاية. وليس من الصعب تقنيًا 
تغيير بنيته؛ ولكن قد يستغرق هذا الأمرُ E55‏ طويلًا؛ نظرًا لجميع العمليات التجارية المرتبطة به. 
ومن ناحية أخرى؛ OB‏ بحيرة البيانات تفتقرٌ إلى بنية مستودع البيانات؛ مما يعطي علماء البيانات 
وامُطوّرين القدرة على تهيئة نماذجهم وطلباتهم وتطبيقاتهم بسرعة وإعادة تشكيلها. 

الحداثة/ الخبرة: كانت التقنيات المتوفرة في مستودع البيانات موجودةً منذ فترة طويلة. 
ومعظم الابتكارات التي حدثت 3& إنجازها في العشرين إلى الثلاثين Gle‏ الأخيرة. ولذلك فإنه لا 
assi‏ تحديث في مستودعات البيانات» وإن وُحِدَ فهو قليلٌ ga) lip‏ استبعاد التقنية اللازمة لتعبئة 
واستخدام «البيانات الكبيرة» داخل مستودع البيانات). وعلى الجانب الآخر؛ OB‏ بحيرات البيانات 
pde‏ وتتقدم من خلال الابتكار والحداثة لتصبح هي التقنية السائدة لمستودعات البيانات. 

الأمان: نظراً لوجود تقنيات مستودع البيانات منذ عقود طويلة؛ l5‏ القدرة على تأمين البيانات 
في مستودع البيانات أكبر بكثير منها في بحيرة البيانات. ومع ذلك؛ فإنه تجدر الإشارة إلى الجهد 
الكبير الذي JAS‏ الآن في مجال الأمان في صناعة البيانات الضخمة. ولا يتعلق الأمرُ Le‏ إذا كان أمن 
بحيرات البيانات سوف يُلبّي متطلبات محترفي التحليلات وغيرهم من المستخدمين النهائيين» أم لا. 

المستخدمون: لقد كان شعار العام التحليلي لفترة طويلة؛ هو «تحليل وفهم الأعمال 
للجميع». وقد أنشأنا مستودع البيانات lagg‏ الدعوة للجميع لاستخدامه؛ ولكن هل استخدموه 
بالفعل؟ والإجابة هي أن نسبة مَنْ استخدموه لا تتعَدّى 70-7١‏ فقط. هل بحيرة البيانات هي 
نفس صيحة مستودع البيانات؟ هل سنقوم بإنشاء بحيرة البيانات وندعو الجميع إلى استخدامها؟ 
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رها يحدث ذلك في المستقبل. G‏ في الوقت الحالي؛ فإن بحيرة البيانات بوضعها «lodi‏ ومرحلة 
النضج التي وصلت إليها sS‏ هي الأنسب لعلماء البيانات. 
وباختصار؛ فإن بحيرة البيانات تختلف عن مستودع البيانات. فبحيرة البيانات ليست هي 
مستودع البيانات (كما اقترح البعض)» كما أنها ليست بديلًا له. فكلاهما مطلوبان ولذلك؛ فقد & 
تحسينهما من أجل وسائط البيانات المختلفة والمهام/ الأغراض المتنوعة. ولذلك؛ فإن كلا الاثنين 
بحاجة إلى التعايش Uo‏ في عالم التحليلات (على الأقل لفترة من الوقت حتى تصل بحيرات البيانات 
إلى مستوى من النضج Giod‏ ما وصلت إليه مستودعات البيانات من الجودة في الوقت الحاضر). 
والهدف هو تصميم واستخدام logio US‏ بشكلٍ صحيح للمهامٌ التي يؤديها؛ بحيث يتم استخدام 
أفضل خيار للعمل» والذي قد يكون مزيجٌ من مستودعات البيانات وبحيرة البيانات. 
duca‏ التحتية (التصميم - الأجهزة والبرمجيات - التحسينات): 
- العمودية (طريقة جديدة لمستودعات البيانات والوصول إليها في قاعدة البيانات): إن نظام 
إدارة قواعد البيانات باستخدام الأعمدة الموجّهة (والمعروف أيضًا باسم قاعدة البيانات 
العمودية). هو BUS‏ يقوم بتخزين جداول البيانات كأجزاء من أعمدة البيانات بدلا من 
أنها صفوف من البيانات (وهي الطريقة التي يستخدمها معظم (RDBMS‏ بمعنى 
أن تخزين قواعد البيانات يتم بشكلٍ sogas‏ فهذه البيانات تُخرّنَ بواسطة أعمدة بدلا من 
الصفوف ex Cun)‏ تخزينٌ كافة قِيَمِ عمود واحد Sis‏ متتابع على ذاكرة القرص). ومثل 
هذا الهيكل يعطي نوعاً من التحكُم أكثر دقة في -RDBMS‏ فهو يستطيعٌ الوصول إلى الأعمدة 
المطلوب الاستعلام عنها فقط دون أن يكون هناك اضطرارٌ إلى الوصول إلى JS‏ أعمدة الصف؛ 
إذ يعمل بشكلٍ أفضل بكثير فيما يخص الاستعلامات التي تحتاج إلى نسبة صغيرة من الأعمدة 
في الجداول الموجودة بها؛ ولكنه يؤدي alae‏ بشكل أسوأ عندما تكون هناك حاجةٌ إلى أعمدة 
كثيرة؛ بسبب الجهد الزائد المطلوب لربط كافة الأعمدة lo‏ لتشكيل مجموعات النتائج. وعادةٌ 
ما تتعلق المقارنات بين مخططات بيانات الأعمدة الموجهة والصفوف الموجهة» بكفاءة الوصول 
إلى القرص الثابت؛ للقيام بتنزيل عمل odo‏ (والذي lola iab‏ من أكتر العمليات التي 
تستغرق 5 طويلًا في الحاسب). los‏ على المهمة المطروحة: يمكن لأحدهما أن يتمتع بمزايا 
أكثر من الآخر. ويكون نظام الأعمدة الموجهة ASÍ‏ كفاءة عندما: 
-١‏ يجب حساب الإجمالي من خلال العديد من الصفوف؛ ولكن فقط للجموعة فرعية صغيرة؛ 
بحيث تكون هذه المجموعة أقل من إجمالي أعمدة البيانات؛ إذ Ól‏ قراءة هذه المجموعة 
الفرعية الأصغر من البيانات تكون أسرع من قراءة ÍS‏ البيانات. 
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-Y‏ يتم تزويدُ جميع الصفوف بقيّم جديدة من أحد الأعمدة في وقتٍ واحد؛ نظرًا لأن بيانات العمود 
يمكن كتابتها بكفاءة واستبدال بيانات الأعمدة القديمة دون لمس أي أعمدة أخرى للصفوف. 
في حين يكون نظام الصفوف الموجّهة أكثر elas‏ عندما: 
-١‏ تكون أعمدة كثيرة من صف واحد مطلوبة في نفس الوقتء وعندما يكون حجم الصف صغيراً 
نسبيًا؛ بحيث oS‏ استرداد الصف بأكمله باستخدام قرص واحد. 
-Y‏ يتم كتابة cio‏ جديد إذا 63 توفير كافة بيانات العمود في نفس الوقت؛ إذ هكن كتابة الصف 
بأكمله باستخدام قرصٍ واحد. 
وإضافة إلى ذلك؛ فإنه نظرًا لأن البيانات iab‏ في أحد الأعمدة تكون من نوع tabs‏ فن 
ذلك يفسح المجال بشكل أفضل للضغط معنى أنه يتوفر مساحة كبيرة لتخزين بيانات الأعمدة 
الموجّهةء وهذه المساحة لا تتوفر في بيانات الصفوف grot!‏ ومثل هذا الضغط اللْحْكّم للبيانات 
من شأنه أنه يقلّل من حجم التخزين؛ مما يجعله CST‏ البدائل التي تجد قب ولا من الناحية 
الاقتصادية متابعة التخزين في الذاكرة أو الحالة الصلبة. 
- مستودعات البيانات الفورية: تنطوي عملية مستودعات البيانات الفورية (RDW)‏ على دورة 
تجديد مستودع البيانات الموجود؛ وذلك من أجل تحديث البيانات الأكثر تكرارًا (ويكون ذلك 
تقريبًا في نفس الوقت الذي تصبح فيه البيانات متاحةً في قواعد البيانات التشغيلية). فهذه 
الأنظمة (أنظمة (RDW‏ يمكنها الوصول إلى تحديث البيانات بشكل فوري تقريبًا؛ إذ يستغرق 
وقت استجابة البيانات عادةً من دقائق إلى ساعات. ومع انخفاض وقت الاستجابة؛ فإن تكلفة 
تحديث البيانات تزداد بشكل كبير. وهناك حاجة إلى edil‏ مس تقبلًا في العديد من المظاهر 
التقنية (بدءًا من اكتساب البيانات تلقائيًا وصولًا إلى أدوات البرمجيات الذكية) لجعل RDW‏ 
حقيقة واقعة بتكلفة معقولة. 
- أجهزة مستودعات البيانات (حلول الكل في واحد لدى (DW‏ يتكوّن جهاز مستودع 
البيانات من مجموعة متكاملة من الخوادم» ووحدات التخزينء ونظام (أو أنظمة) التشغيلء 
وأنظمة إدارة قواعد البيانات» والبرمجيات المثبتة بشكل مُسبّقء As‏ من أجل مستودعات 
البيانات. ومن الناحية العملية؛ فإن أجهزة مستودع البيانات توفر حلولًا من أجل مستودع 
البيانات المتوسطة لدى سوق مستودع البيانات الكبيرة؛ إذ تقدّم Fol‏ منخفص التكلفة على 
أحجام البيانات في نطاق من Cobha‏ إلى نطاق البيتابايت. ويستخدم معظم gogo‏ أجهزة 
مستودعات البيانات تصميمات معالجة متوازية كثيفة من أجل تحسين الأداء. وعلى الرغم من 
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أن معظم مُورّدي قواعد البيانات ومستودعات البيانات يوفرون الأجهزة في الوقت الحاضر غير 
Ol‏ الكثيرين يعتقدون أن تيراداتا كانت أول من قدَّم منتجًا يتمثل في جهاز لمستودعات البيانات 
التجارية. وأكثر ما يُلاحَظ حاليًا هو ظهورٌُ حُرّمَ مستودعات البيانات؛ إذ يقوم المورّدون qo‏ 
برمجياتهم وقواعد بياناتهم كمنصّة لمستودعات البيانات. 
Ld‏ من ناحية مزايا أجهزة مستودع البيانات؛ ÓL‏ التكلفة الإجمالية للحصول عليها وتهلّكها 
منخفضة للغاية, والتي تشمل تكاليف الشراء الأوليةء وتكاليف الصيانة المستمرة وتكلفة تغيير 
السّعة مع نمو البيانات. كما 23 JS.‏ تكلفة الموارد اللازمة لمراقبة وضبط مستودع البيانات نسب 
bgs‏ من إجمالي تكلفة ا ملكيةء وغالبًا ما تصل هذه النسبة إلى X‏ وإضافةٌ إلى ما سبق؛ فإن 
أجهزة DW‏ تعمل على الحَدَّ من إدارة العمليات اليومية وا متمثلة في التشغيل والإعداد والتكامل. 
ونظرًا GY‏ أجهزة مستودعات البيانات توفر حل المورد الواحد؛ فإنها تتجه إلى تحسين الأجهزة 
والبرامج بشكل أفضل داخل الجهاز؛ إذ يعمل هذا التكامل ا موحد على زيادة فرص الاندماج الناجح 
واختبار نظم إدارة قواعد البيانات (DBMS)‏ والتخزين ونظام التشغيل عن طريق de‏ بعض 
مشكلات التوافق التي تنشأ عن الحلول التي gadi‏ مُورّدون مُتعدّدون. كما يوفر جهاز مستودع 
البيانات نقطة اتصال واحدة ad‏ المشكلة ومسار ترقية أبسط بكثير لكل من البرامج والأجهزة. 
- تقنيات وممارسات إدارة البيانات: تتضمّن بعض الاحتياجات AÅ‏ للجيل القادم من برنامج 
مستودع البيانات التقنيات والممارسات التي لا نفكّر فيها عمومًا على اعتبار أنها tja‏ من النظام 
الأساسي؛ إذ يحتاج العديدٌ من المستخدمين على وجه الخصوص إلى تحديث أدوات إدارة البيانات 
التي تعمل على معالجة البيانات؛ لتصبح صالحةً للاستخدام من خلال مستودع البيانات. ويحمل 
المستقبل 152 قويًا لإدارة البيانات الرئيسية (MDM)‏ ورغم كون هذا المفهوم جديداً نسبيًا غير 
أنه بالغ الأهميةء وسوف يَحْظى بشعبية كبيرة 6 أسباب» وتشمل ما يلي: 

(MDM) إلى إدارة بيانات رئيسية‎ ba مع الأنظمة التشغيلية‎ ell goil إن‎ -١ 

-Y‏ إن معظمّ مستودعات البيانات لا تزال تفتقرٌ إلى وظائف إدارة البيانات الرئيسية وجودة البيانات. 

Gle يجبٌ أن تكون التقاريرٌ التنظيمية والمالية دقيقةٌ ونظيفة‎ -Y 

- تقنية معالجة قاعدة البيانات (وَضْع نظام الحلول الحسابية حيث تكون البيانات): تشيرٌ 
معالجة قواعد البيانات Lal pasg)‏ تحليلات قواعد البيانات) إلى مدى التكامل الحسالي 
لتحليلات البيانات في مستودع البيانات. وبمجرد القيام بذلك؛ فإن البيانات والتحليلات تتكامل 
لتصبح ضمن بيئة واحدة. فوجود كلا الاثنين في بيئة واحدة يزيد من كفاءة إجراء التحليل 
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الحسابي المكثف. واليوم zs‏ العديدٌ من أنظمة اتخاذ القرارات على قواعد البيانات الكبيرة 
مثل تلك Aedes ll‏ في الكشف عن الاحتيال على بطاقات الائت مان وإدارة مخاطر البنوك 
الاستثمارية؛ إذ ext Lal‏ هذه التقنية نظرًا لإظهارها Bus os‏ في الأداء يتفوق على الطرق 
التقليدية في بيئة اتخاذ القرار والتي يش كل فيها الوقت عاملًا مهمًا. Aids‏ معالجة قواعد 
البيانات Bass flas‏ إذا ما قورنت بالطريقة التقليدية لإجراء التحليلات؛ إذ يتم نقل البيانات 
خارج قاعدة البيانات (وغالبًا ما تكون في شكل ملفات 24 dah‏ تتألف من صفوف وأعمدة) 
إلى itu‏ تحليلية منفصلة (مثل SAS Enterprise Modeler‏ أو Statistica Data Miner‏ أو 
(IBM SPSS Modeler‏ للمعالجة. 
iig‏ المعالجة داخل قواع د البيانات LSÍ‏ منطقيةً بالنسبة لبيئات التطبيقات العالية 
الإنتاجية الفورية» والتي gias‏ شف الاحتيال» وسجل الائثتمانء وإدارة المخاطرء ومعالجة 
امعاملات» والتسعير وتحليل الهامشء والتجزئة الدقيقة المستندة إلى الاستخدام واستهداف 
الإعلانات السلوكية» ومحركات التوصيةء مثل تلك التي تستخدمها مؤسسات خدمة العملاء 
لتحديد الإجراءات التالية الأفضلء ويتم تنفيذ ومعالجة البيانات Jal‏ قاعدة البيانات على 
اعتبار أنها مَيْرْةء من قبل العديد من مُورّدي مستودعات البيانات الرئيسيينء ا في ذلك 
تيراداتا )3 e‏ قدرات SAS analytics‏ في أجهزة مستودعات IBM Netezzas (OLLI‏ 








Sybases EMC Greenplums‏ من بين البرامج الأخرى. 

- تقنية التخزين في الذاكرة (نقل البيانات في الذاكرة؛ حتى تتم المعالجة بشكلٍ أسرع): تستخدم 
أنظمة قواعد البيانات التقليدية مثل RDBMS‏ محركات الأقراص الصلبة الفعلية لمستودعات 
البيانات بشكل مثالي لفترة طويلة من الوقت؛ إذ يقوم نظام إدارة قاعدة البيانات بتنزيل البيانات 
(أو أجزاء من البيانات) إلى الذاكرة الرئيسية عند طلب عملية متعلقة بالبيانات بواسطة أحد 
التطبيقات» ويعالجهاء ويستجيب Eyo‏ أخرى للتطبيق. وعلى الرغم من أن البيانات (أو أجزاء 
من البيانات) aS‏ مؤقنًا في الذاكرة الرئيسية في نظام إدارة قاعدة البيانات؛ O‏ موقع التخزين 
الأماسي يظل عبارة عن قرص مغناطيسي ثابت. وفي المقابل؛ فإن نظام قاعدة البيانات في الذاكرة 
يقوم بالاحتفاظ بالبيانات بشكل دائم في الذاكرة الرئيسية. وعندما تُطلب عملية تتعلق بالبيانات 
بواسطة تطبيق ما؛ فإن نظام إدارة قواعد البيانات يصل مباشرةً إلى البيانات الموجودة بالفعل في 
الذاكرة الرئيسيةء ويعالجهاء ويستجيب s‏ أخرى للتطبيق الذي يطلبه. إِنَّ هذا الوصول المباشر 
إلى البيانات في الذاكرة الرئيسة يجعل معالجة أوامر البيانات أسرع بكثير من الطريقة التقليدية. 


YAM‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


لذا؛ Ole‏ الفائدة الرئيسة للتقنية في الذاكرة (بل قد تكون الفائدة الوحيدة لها) تتمثل السرعة 
مذهلة التي تصل بها إلى البيانات. GÍ‏ العيوب فتشمل: تكلفة الحصول على ذاكرة رئيسة 
كبيرة للغاية (فحتى لو تم الحصول عليها بتكلفة أقلء إلا أنه لا يزال هناك الكثيرُ لتوفير ذاكرة 
رئيسية كافية لاحتواء جميع بيانات الشركة). إضافةً إلى الحاجة إلى إستراتيجيات معقدة لاستعادةٌ 
البيانات (لأن الذاكرة الرئيسية مُتقلّبة ويمكن محوها بطريق الخطأ). 
- نظم إدارة قواعد البيانات الجديدة: تتكوّن dale‏ مستودع البيانات من عِذَّة مكونات أساسية, 
أهمّها نظام إدارة قواعد البيانات izg (DBMS)‏ ذلك s]‏ طبيعيا فقط؛ oÙ‏ نظام إدارة 
قواعد البيانات (DBMS)‏ هو 555 النظام الأساسي؛ 31 Gl‏ معظم العمل يجب إنجازه بغرض 
تنفيذ نموذج بيانات وتحسينه لأداء الاستعلام. ولذلك؛ e‏ نظام إدارة قواعد البيانات (DBMS)‏ 
هو المكان الذي يتوقع أن تحدث فيه Lai‏ من ابتكارات الجيل التالي. 
- تحليلات مُتقدّمة: هناك طرق تحليلية مختلفة يمكن للمستخدمين اختيارها في أثناء انتقالهم 
إلى ما وراء الأساليب الأساسية المستندة إلى OLAP‏ والتحليلات المتقدّمة. إذ يختار بعص 
المستخدمين طرقًا تحليليةً Sas fouito‏ على التنقيب في البيانات» والتحليلات التنبؤية, 
والإحصاءات» والذكاء الاصطناعيء وما إلى ذلك. ومع ذلك؛ فمن الواضح أن غالبية ا مستخدمين 
يختارون الأساليب المستندة إلى SQL‏ وسواءً اعتمدوا على SQL‏ أم Y‏ فيبدو أن التحليلات 
المتقدّمة A5‏ من بين Gal‏ الأمور المبشّرة بنجاح مستودعات البيانات في الجيل التالي. 
ومن الواضح أن مستقبل مستودعات البيانات ملي بالوعود والتحَدّيات الكبيرة. وإذ إِنَّ عام 
الأعمال أصبح أكثر áste‏ وتعقيدً؛ فإن الحاجة إلى أدوات ذكاء الأعمال وأدوات استرجاع البيانات 
سوف تصبح أكثر من ذي قبل. كما يبدو أن أدوات وتقنيات تقنية المعلومات سريعة التحشّن 
تتحرك في الاتجاه الصحيح لتلبية احتياجات أنظمة ذكاء الأعمال المستقبلية. 





أسئلة مراجعة على القسم A-Y‏ 

-١‏ ما الخطوات التي تكن للمؤسسة اتخاذها لضمان أمان وسرية بيانات العميل في مستودع 
البيانات الخاص بها؟ 

-Y‏ ما هي المهارات التي يجبٌ أن تتوفر في $DWA‏ وطاذا؟ 

-Y‏ ما هي التقنيات الحديثة التي قد تشكّل مستقبل مستودعات البيانات؟ وماذا؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YAS‏ 


الفصل الثالث 


٩-۳‏ إدارة elal‏ الأعمال: 


تنتهي العديدُ من تطبيقات مستودع البيانات بتطوير نظام إدارة أداء الأعمال (BPM)‏ 
ففي الأعمال والأدبيات التجارية؛ نجد BPM Gl‏ لديها Sae‏ من Le el. LI‏ في ذلك إدارة أداء 
الشركات (CPM)‏ وإدارة أداء المؤسسات (EPM)‏ وإدارة ا مشاريع الإستراتيجية (SEM)‏ وقد 
e‏ إنشاءٌ CPM‏ بواسطة شركة Garner‏ لتحليل السوق .(gartner.com)‏ وأمًا EPM glaas‏ 
فهو مصطلحٌ hs‏ بعروض Oracle (oracle.com)‏ بنفس الاسم. SEM Us‏ فهو ا مصطلح 
الذي تستخدمه .(sap.com) SAP‏ وقي هذا الفصل؛ يفل مصطلح BPM‏ على المصطلحات 
الأخرى؛ لأنه الأقدم والأكثر استخدامًا بشكل عام والوحيد الذي لا يرتبط ارتباطًا وثيقًا موفر Jal‏ 
الواحد. ويشير مصطلح إدارة أداء الأعمال (BPM)‏ إلى طريقة سَيْر الأعمال والمنهجيات والمقاييس 
والتقنيات Aedes ad‏ من قبل الشركات لقياس أداء الأعمال ومراقبتها وإدارتها. ويشمل ثلاثة 
مكونات رئيسية )2009 :(Colbert,‏ 

-١‏ مجموعة من الإدارات المتكاملة في حلقة مغلقة. وعمليات التحليل (مدعومة بالتقنية) التي 

تتناول الأنشطة AJU‏ وكذلك الأنشطة التشغيلية. 

-Y‏ أدوات للشركات لتحديد الأهداف الإستراتيجيةء ومن S‏ قياس وإدارة الأداء في مقابل تلك الأهداف. 
*- مجموعة أساسية من العمليات» Le‏ في ذلك التخطيط JUI‏ والتشغيليء والاندماج وتقديم c2 UI‏ 

والنمذجة» والتحليلء 3255 مؤشرات الأداء الرئيسية (KPIS)‏ المرتبطة بالإستراتيجية التنظيمية. 


دورة BPM‏ المغلقة: 


رها يكون أهم الاختلافات بين (sls BPM‏ أدوات وممارسات أخرى لذكاء الأعمالء هو التركيز 
على الإستراتيجية الخاصة به؛ ò|‏ يشمل BPM‏ مجموعةً من العمليات المغلقة التي تربط 
الإستراتيجية بالتنفيذ لتحسين أداء الأعمال (انظر: شكل (Y-Y‏ ويُقصّد بالحلقة؛ أن الأداء الأمثل 
يتحقق من خلال تحديد الأهداف والغايات (أيْ: وضع إستراتيجية). وإنشاء مبادرات وخطط 
تحقيق تلك الأهداف (أيْ: «(alas‏ ومراقبة الأداء الفعلي مقابل الأهداف والغايات ssl)‏ ا مراقبة)» 
واتخاذ الفعل المناسب للإصلاح ssl)‏ الفعل والضبط). فالطبيعة المستمرة والمتكرّرة للدورة تعني 
S‏ إكمال التكرار يؤدي إلى عملية جديدة ومُحسّنة (دعم الجهود المستمرة لتحسين العمليات). 
ونتناول في هذا القسم وَصّف هذه العمليات الأربع. 


۳۹۰ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 

















شكل :M-Y‏ حلقة مغلقة لدورة BPM‏ 


-١‏ وضع الإستراتيجية: أين نريد أن نذهب؟ 

عرف الإستراتيجية بشكل عام» بأنها all‏ عمل عالية المستوىء تشمل iia) Bj‏ طويلةٌ 
(غالبًا Bas‏ سنوات) لتحقيق هدفٍ dod‏ وهي ضروريةٌ بشكل خاص في حالة وجود العديد 
من القيود (مدفوعة بأوضاع السوقء وتوفّر المواردء والتعديلات القانونية/ السياسية) للتعامل 
معها في طريقها نحو تحقيق الهدف. في حين تُعرّف الإستراتيجية في إطار الأعمال التجارية بأنها 
(des $$‏ صياغة القرارات التي تساعد الشركات على تحقيق أهدافها. وبشكل أكثر تحديدًا؛ فهي 
عملية تحديد وتوضيح مهمة المنظمة ورؤيتها وأهدافها ووضع خطط (على مستويات مختلفة 
من الدقة - الإستراتيجية والتكتيكية والتشغيلية) لتحقيق هذه الأهداف. 

وعادةً ما يتم إنشاءٌ وتخطيط إستراتيجيات الأعمال من قبل فريق من المسؤولين التنفيذيين 
في الشركات LIL)‏ يقود هذا الفريق ا مدير التنفيذي)» ويقوم مجلس الإدارة بالموافقة عليها 
والتصريح بهاء ثم يقوم فريق إدارة الشركة بتنفيذها تحت إشراف كبار المسؤولين التنفيذيين. 
وتوفر إستراتيجية الأعمال اتجاكًا Ule‏ للمؤسسة وَتُعَدُ أول olg‏ عملية في منهجية BPM‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yay‏ 


الفصل الثالث 


-Y‏ الخطة: كيف تصل إلى هناك؟ 

gles Louis‏ المديرون التنفيذيون ويقهمون ما (الأهداف, والأهداف التنظيمية)» سيكونون 
قادرين على التوصل إلى كيفية gig)‏ خطط تشغيلية ومالية (Lais‏ بحيث dags‏ الخطط 
التشغيلية والمالية عن سؤالين: ما هي التكتيكات والمبادرات التي سيتم اتباعها لتحقيق أهداف 
الأداء Salot‏ في الخطة الإستراتيجية؟ وما هي النتائج المالية المتوقعة لتنفيذ التكتيكات؟ 

تعمل الخطة التشغيلية على ترجمة الأهداف والأهداف الإستراتيجية لمنظمة ما إلى مجموعة 
من التكتيكات والمبادرات المحدّدة جيدًا. ومتطلبات الم وارد» والنتائج المتوقعة لبعض الوقت في 
المستقبلء ales‏ (ولكن ليس (Glo‏ ما تكون هذه المدة Úle‏ وتشبه خطة التشغيل في جوهرها 
خطة المشروع التي تم تصميمها؛ لضمان تحقيق إستراتيجية المؤسسة. وتشتمل معظم الخطط 
التشغيلية على مجموعة من التكتيكات والمبادرات. Ul‏ مفتاح النجاح في التخطيط التشغيلي فهو 
التكامل. وتقود الإستراتيجية إلى التكتيكات» وتقود التكتيكات إلى النتائج. وبشكل أساسي Cana‏ ربط 
التكتيكات والمبادرات baadi‏ في خطة تشغيلية بشكل مباشر بالأهداف والغايات الرئيسية في الخطة 
الإستراتيجية. وإذا لم يكن هناك blaj‏ بين تكتيك فردي وهدف أو أهداف إستراتيجية أو أكثر؛ فإنه 
ينبغي على الإدارة أن تتساءل Ge‏ إذا كان التكتيك والمبادرات المرتبطة به مطلوبةٌ Sad‏ على الإطلاق. 
وقد تمّ تصميمٌ منهجيات BPM‏ والتي ستناقش لاحقاً في هذا الفصل للتأكد من وجود هذه الروابط. 

Ol‏ عملية التخطيط ووضع الميزانية المالية لديها بنية منطقية تبدأ Bs‏ بتلك التكتيكات 
التي تُولّد شكلاً من أشكال الإيرادات أو الدخل. وتعتمدٌ القدرة على توليد الدخل في المنظمات 
التي تبيع الس لع أو الخدمات GI‏ على القدرة على إنتاج السّلع والخدمات مباشرة أو الحصول 
على الكمية المناسبة من السلع والخدمات للبيع. وبعد تحديد رقم الإيرادات؛ فإنه يمكن توليد 
التكاليف المرتبطة بتسليم ذلك المستوى من الإيرادات. وفي AS‏ من الأحيان؛ فإن ذلك يستلزمٌ 
مدخلات من عدة أقسام أو تكتيكات. وهذا يعني أنه cao‏ أن تتمّ هذه العملية بطريقة تعاونية 
وأن التبعية بين المهامٌ glos‏ أن يتم توصيلها وفهمها بوضوح. وإضافةً إلى ا مدخلات التعاونية؛ 
فإن المنظمة Léi glos‏ إلى إضافة العديد من التكاليف العامة؛ فض XL‏ عن تكاليف رأس المال 
المطلوب. وبمجرد gi‏ هذه المعلومات؛ فإنها تُوضّح التكلفة بالتكتيك فضلًا عن المتطلبات 
النقدية والتمويلية لوضع الخطة موضع التنفيذ. 


var‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


-Y‏ المراقبة/ التحليل: كيف نؤدي؟ 

من الضروري مراقبة أداء ا منظمة عندما تكون الخطط التشغيلية والمالية فَيْد التنفيذ. وينبغي 
أن يتناول الإطار الشامل لرصد الأداء قضيتين رئيسيتينء وهما: ما الذي يجب مراقبته» وكيفية 
مراقبته. Bhig‏ لأنه من المستحيل ملاحظة S‏ شيء؛ OB‏ المنظمة تحتاج إلى التركيز على مراقبة 
قضايا Saiak‏ وبعد أن ados‏ المنظمة المؤشرات أو المقاييس التي يجب ملاحظتها؛ فإنها تحتاج 
إلى تطوير إستراتيجية a‏ تلك العوامل والاستجابة لها بفعالية. وغالبًا ما AS‏ هذه المقاييس 
مؤشرات الأداء الرئيسية KPIS sl)‏ باختصار). وسوف نقدّم نظرةً عامة على عملية تحديد 
مؤشرات الأداء الرئيسة لاحقًا في هذا الفصل. وهناك E gòga‏ آخر له صلة باختيار ا مجموعة 
المثلى من مؤشرات الأداء الرئيسة وهو طريقة بطاقة نقاط التوازنء والتي سيتمٌ تغطيتها بالتفصيل 
لاحقًا في هذا الفصل. 
-٤‏ الفعل والضبط: ما الذي نحتاج إلى القيام به بشكلٍ مختلف؟ 

وسواءً أكانت الشركة مهتمة بتنمية أعمالها أو حتى على الأقل بتحسين عملياتها؛ OB‏ جميع 
الإستراتيجيات تعتمد فعليًا على مشروعات جديدة كإنتاج منتجات جديدة أو دخول أسواق 
duae‏ أو اكتساب Mas‏ جُدد أو شركات جديدة: أو تبسيط بعض العمليات. وتتعامل معظم 
الشركات مع هذه المشاريع الجديدة بروح من التفاؤل بدلا من الموضوعيةء متجاهلةٌ حقيقة أن 
معظم المشاريع القائمة والمشاريع الجديدة تفشل. ولكن ما هي فرصة الفشل؟ من الواضح؛ أن 
ذلك يعتمد على نوع المشروع )2007 geli. (Slywotzky & Weber,‏ هوليود تضع نسبة احتمال 
للفشل حوالي XI‏ وينطبق الشيء نفسه على عمليات gaill‏ والاستحواذ. كما أن مشاريع تقنية 
المعلومات الكبيرة تفشل معدل XVe‏ وبالنسبة للمنتجات الغذائية الجديدة؛ فإن معدل الفشل 
هو Ul XA‏ بالنسبة للمنتجات الصيدلانية الجديدة؛ OB‏ نسبة احتمال الفشل أعلى من ذلك؛ 
فهي حوالي XA‏ وعمومًا فإن معدل الفشل phat‏ المشاريع القائمة أو المشاريع الجديدة Ag‏ 
ما بين Arg T‏ وبالنظر إلى هذه الأرقام؛ فإن الإجابة على سؤال «ماذا نحتاج أن نفعل بشكل 
مختلف؟» تصبح قضية حيوية. 

وتوضّح الحالة العملية *-0 كيف حققت منظمة كبيرةٌ غير ربحية نتائج استثنائية عن طريق 
تحويل وتحديث بنية ذكاء الأعمال الخاصة بها مع أجهزة مستودعات البيانات في العصر الحديث. 
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حالة عملية ٥-۳‏ 
AARP‏ تقوم بتحويل dco‏ ذكاء الأعمال التحتية 
وتحقق عائد استثمار بنسبة ۳٤۷‏ في ثلاث سنوات 
AARP, In a5‏ - وهى الرابطة الأمريكية للأشخاص المتقاعدين سابقًا - مجموعة 
ذات شأن وعضوية lis‏ الولايات المتحدة. تأسّست في عام 1908م من قبل Ethel‏ 
Percy Andrus‏ وهى å alzi‏ متقاعدة من كاليفورنيا حاصلة على الدكتوراه و 
A «Leonard Davis‏ س مجموعة المستعمرات Penn‏ لشركات التأمين. وكما هو 





gs‏ في موقع الويب الخاص بهم t(aarp.org)‏ فإن الرابطة 455 Alis‏ غير ربحية 
وغير حزبيةء كما أنها منظمة رعاية اجتماعية تضم ما يقرب من YA‏ مليون شخص؛ 
إذ تساعد الناس على تحويل أهدافهم وأحلامهم إلى إمكانيات حقيقية» كما تعرز 
ا مجتمعات lodi!‏ وتحارب من أجل القضايا المهمة للعائلات. مثل: الرعاية الصحية 
والتوظيف» والأمن» والدخلء والحماية من سوء المعاملة AJU)‏ 

تزايد الطلب على ذكاء الأعمال: 

في عام eY +Y‏ أطلقت ال منظمة J59‏ مرة مبادرة ذكاء الأعمال التي من شأنها أن 
تمركز المعلومات (تمتلك AARP‏ مكاتب في جميع الولايات الخمسين؛ إضافةٌ إلى مقاطعة 
كولومبيا)ء وقد تمكّن موظفوها مع توفر تحليلات حالية وملائمة ودقيقة ومرنة من: 

- ملاءمة الخدمات وعروض المنتجات للقاعدة العضوية والتوقعات. 

- تحسين ربحية الأعضاء والاحتفاظ «eap‏ وگسبهم. 

- حماية صورة العلامة التجارية ل AARP‏ من خلال إدارة العلاقات مع مزؤّدي 
الخدمات التابعين لجهات خارجية. 

وقد ساعدت هذه الرؤية في تعزيز نجاح الرابطةء ومع هذا النجاح؛ جاءت كميات 
أكبر من البيانات وزيادة الطلب على التحليلات الجديدة. 

وبحلول عام Y A‏ واجه فريق ذكاء الأعمال ffe Gaos‏ إذ م X35‏ مستودع 
البيانات الخاص بهم - المستند على قاعدة بيانات SQL‏ العلائقية من Oracle‏ - قادرًا 
على مواكبة الطلب؛ إذ شهد الفريق أكثر من ٠١‏ حالة فشل في تلك السنة. وقد كان 
هذا الأمر مكلقًا وغير مقبول. 
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وإضافة إلى ما سبق؛ فقد كان أداء النظام مصدر قلق رئيسي. ونظرًا لتزايد حجم 
البيانات» وتعَذّر إكمال التنزيل اليومي إلى مستودع المستندات حتى الساعة Elisa ٠:٠١‏ 
- وهو ما أثر على طول Bas‏ انتظار الموظفين للتقارير. تقول بروني مديرة ممارسة ذكاء 
:AARP «JU. eSI‏ «كان محللونا يقومون بإعداد تقريرء ثم الذهاب لتناول القهوة أو 
لتناول طعام الغداء وربما يحصلون على o‏ إذ! كانوا محظوظينء بحلول الساعة 0:٠١‏ 
tua‏ إن هذا الأمر كان غير مقبول؛ فقد كان النظام مش Sas‏ للغاية في كتابة البيانات 
اليومية الجديدة لدرجة أنه م يعط gi‏ أهمية لعمليات القراءة التي قام بها ا مستخدمون». 

bg‏ يتمكّن ا محللون أيضًا من إنشاء استعلامات مُخصّصة دون تدخل لتقنية المعلومات. 
فعندما oA‏ تقنية ا معلومات Ub‏ لنوع جديد من التقارير؛ كان على فريق ذكاء الأعمال 
تحسين الاستعلامات وإرسال نموذج تقرير oe‏ أخرى إلى الطالبين للمراجعة. وتستغرق هذه 
العملية من بدايتها إلى نهايتها من أسابيع إلى شهور. وقد وجد الموظفون fool‏ أنه من 
المستحيل عمل نسخة احتياطية من النظام ÍS‏ ليلة بوجود أكثر من Y‏ تيرابايت من البيانات 
في مستودع البيانات. ولذلك؛ فقد اقتصرت aca‏ الاحتياطية على بضع جداول حرجة؛ مما 
جعل من الصعب على اللوظفين إنشاء خطة Uid‏ لاستعادة القدرة على العمل بعد الكوارث. 

ووفقاً لبروني؛ فإن هذا الأمر إذا di‏ دون Jo‏ فمن الممكن أن تؤثر هذه التصدّعات 
على عمل الرابطة. تقول بروني: «يوفر التحليل مقاييس أساسية مهمة لتقييم مدى 
تحقيق عضويتنا وأهدافنا الاجتماعية؛ فمن الضروري تمكين التحسين المستمر واتخاذ 
القرارات؛ لدعم احتياجات الأعضاء». 

إنشاء بيئة رشيقة لذكاء الأعمال: 


ella f o‏ فريق بروني إلى تحديث بيئة ذكاء الأعمال؛ فقد قاموا بتقييم خيارين, 
وهما: تحسين البيئة الحالية أو الانتقال إلى جهاز مستودع بيانات واحد. تقول بروني: 
«لقد وجدنا تكلفة S‏ خيار قابلة للمقارنة؛ ولكن الجهاز فقط هو الذي قَدَّم U‏ 
نقلة نوعيةً فيما يتعلق بالأداء الذي S‏ نحتاجه. ومن بين الخيارين امختلفين اللذين 
درسناهماء استطاع جهاز مستودعات البيانات IBM Netezza‏ أن يتفوق على الخيار 
الآخر؛ نظرًا لكونه أكثر iG]‏ إذ إنه لم يتطلب من نموذج البيانات ضبطًا às‏ مخازن 
البيانات الأخرى. وإضافةً إلى ذلك؛ فقد استطعنا تجربة الجهاز قبل شرائه لمعرفة 
حقيقة ما إذا كان بإمكانه فعْل JS‏ ما نحتاج إليه أم Y‏ وذلك على الرغم من أن معظم 
البائعين لا يقدّمون هذا psi‏ من الخيارات وهو (تجربة الجهاز قبل الشراء)». 
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وقد CÉS‏ المنظمة نموذج تطوير «سكروم» في بناء البيئة الجديدة» والذي يُستخدّم 
ole‏ من قبل as‏ 55 البرامج؛ لتوفير إطار عمل يختصر دورات التطويرء كما أنه 
g ud‏ الوقت لتسويق طلبات ذكاء الأعمال. وتضيف بروني: ol»‏ استخدام سكروم في 
مستودعات البيانات؛ هو شيءٌ جديدٌ لم يسمع به أحد؛ لكن المبدأ الأماسي الذي يقدّمه 
هو عملية مرنة وتكرارية SUE‏ من تحويل الاحتياجات التحليلية للمستخدمين بسرعة 
إلى تقارير تشغيلية تُظهر بيانات ذات معنى». 


وخلال ٩‏ أشهر من اقتناء الجهاز الجديد؛ قام الفريق بتحويل جميع النصوص 
والإجراءات من قاعدة بيانات أوراكل إلى جهاز مستودع البيانات eus IBM Netezza‏ 
حاليًا boss‏ مصادر بيانات d$‏ من الحسابات الأساسية وبيانات العضوية (التي تتواجد 
في IBM DB2‏ لقاعدة بيانات 2/05 والتي تعمل على (IBM System z el‏ وبيانات 
الموارد المالية والبشرية من قواعد بيانات أصغر أخرىء وبيانات تحليل وتجزئة الحملات 
من بيانات جهات خارجية في جهاز مستودع البيانات X IBM Netezza‏ إذ يمكن 
الوصول إليها من خلال أدوات ذكاء الأعمال للمنظمة دون انقطاع. 

تشغيل استعلامات مُعفّدة في سرعة البرق: 

من حيث الأداء (والذي كان أكثر اهتمامات فريق ذكاء الأعمال إلحاحًا)؛ فإن JUS]‏ 
تنزيل البيانات اليومية الآن يتم قبل الساعة luo ۸:٠١‏ وهو تحسن بنسبة ۱٤٠١‏ 
كما أن إكمال التقارير التي كانت تستغرق دقائق من قبل للتشغيل أصبح يتم الآن في 
عدة ثوان» وهو تحسن بنسبة XW-‏ وفضلًا عن ذلك؛ فقد ساعد اقتناء الجهاز أيضًا 
في ضغط حجم البيانات من YA‏ تيرابايت إلى ١,0‏ تيرا Cab‏ فقط؛ مما يتيح لفريق العمل 
الاحتفاظ بنسخة احتياطية من مستودع البيانات في ١‏ دقيقة فقط. 


وعلى نفس القدر من الأهمية؛ فإن ما يقرب من YY*‏ من موظفي الموارد البشرية, 
وامماليةء والتسويقء إضافةً إلى موظفي الحملة الذين يستخدمون هذا النظام؛ يمكنهم 
OY‏ إجراء ما تشير إليه بروني بأنه «تحليل تدريب الفكر»؛ بمعنى إنشاء تقارير 
مُخصّصة لاختبار النظريات المتعَلّقة باحتياجات العضوية. وتقول بروني: òb‏ جهاز 
مستودع البيانات IBM Netezza‏ يشبه قيادة سيارة فيراريء لقد فتحنا le‏ جديدً! من 
الإمكانيات لعملائنا الداخليين الذين يمكنهم فعلًا إنشاءٌ تقارير على الفور والحصول 
على النتائج في غضون li‏ معدودة. وقد ag‏ ارتفاعًا كيا في عدد التقارير التي 
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تم إنشاؤها في الأشهر القليلة الأولى من التشغيل؛ أي ما يقرب من ثلاثة أضعاف الرقم 
الذي كنا قد أيّدناه من قبل. وإضافةً إلى الغوص العميق الذي opLE‏ القيامُ به الآن؛ 


فقد ÉG 152 bugò‏ في عمليات تجديد العضويات واكتساب أعضاء جدد. والمشاركات». 

تحقيق عائد الاستثمار السريع: 

كما مكّن النظامٌ الأماسي الجديد المنظمة من Bale]‏ نشر موظفي دعم تقنية 
المعلومات من مجموعة ذكاء الأعمال إلى مناطق أخرى. فقد كان الفريق في السابق 
بحاجة إلى مسؤول قاعدة بيانات بدوام كامل (DBA)‏ إلى جانب دَعْم جزئي من شبكة 
منطقة التخزين الخاصة بالمنظمة (SAN)‏ وفرق الخدمة المتوسطة. تقول بروني: «إنه 
لأمرٌ مدهشٌء a b‏ بحاجة إلى دعم تقنية المعلومات؛ إذ يتخ GSi‏ جهاز مستودع 
البيانات IBM Netezza‏ بالفعل. فقط امنحه gäl‏ واعطه شبكة. وبفعل ذلك فقد 
انتهي الأمرء ولا يحتاج أي شيء آخر». 





وقد منت هذه التحسينات المؤسسة من تحقيق عائد استثماري Lua‏ في 
السنة الأولى» مع عائد استثمار متوقع بنسبة ۲۷٤‏ في السنة الثانية» واستثمار بنسبة 
۷ بحلول السنة الثالثة. تقول بروني: «لقد أظهر تحليلنا J59‏ عائد استثمار إيجابي 
في العام الأولء وهو Sal‏ غير مألوف ll‏ بالنسبة لتحديث البنية التحتية؛ نظرًا إلى أن 
جميع التكاليف غير متكررة في السنة الأولىء ولقد كان التنفيذ الفعلي معدل العائد 
على الاستثمار أعلى من ذلك؛ bagil‏ عملية المقايضة قبل ثلاثة أشهر من الموعد المحدد». 

توسيع تأثير ذكاء الأعمال: 

لقد أدرك فريق بروني القيمة العالية لذكاء الأعمال في المنظمة من خلال تحديث 
بنيته التحتية. تقول بروني: aso»‏ أن انتقلنا إلى TBM Netezza‏ انتشر الكلام US Lol,‏ 
نفعل الأشياء بشكلٍ صحيح. وأن الاستفادة من الخدمة الداخلية كانت ذكية للغاية؛ لقد 
اكتسبنا مجالات حيوية جديدة للمهمة» مثل منطقة التأثير الاجتماعي التي تدعم حملاتنا؛ 
من أجل القضاء على «sedi‏ وإنشاء حملات جيدة تستند إلى حقيقة أن لدينا بنية تحتية 
قوية. وإضافةً إلى ذلك؛ فقد غيّرنا منهجنا في العمل؛ إذ يمكننا التطوير بطريقة أكثر مرونةً 
هذا من ناحية التنمية. Ul‏ من ناحية إدارة البرنامج؛ فإنها تقلّص دورات إطلاقنا من 
أشهر - والتي تتناسب مع E‏ التحتية التقليدية لبرمجيات البيانات - فقط لعدة أسابيع. 
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أسئلة للمناقشة: 

-١‏ ما هي التحَدَّيات التي تواجهها الرابطة؟ 

-Y‏ ماذا كان النهجٌ المتّبع من أجل وَضْعِ d>‏ ممكن؟ 

-Y‏ ما هي النتائج التي 63 الحصول عليها على المدى القصير؟ وماذا كانت الخطط المستقبلية؟ 
Source: IBM customer success story. (2011). AARP transforms its business‏ 
intelligence infrastructure—Achieving a 34796 ROI in three years from BI‏ 


modernization effort. http://www-03.ibm.com/soft-ware/businesscasestudies/us/en/ 


corp?synkey-A735189Y23828M82 (accessed June 2016). 


أسئلة مراجعة على القسم AY‏ 

-١‏ ما هي إدارة أداء الأعمال؟ كيف ترتبط بذكاء الأعمال؟ 

$BPM els) ما هي المكونات الرئيسية الثلاثة‎ -Y 

-Y‏ اذكر المراحل الأربع لدورة BPM‏ وصفها بإيجاز. 

AS IU -£‏ الإستراتيجية هي الجزء الأكثر faal‏ من تنفيذ SBPM‏ 


٠۰-۳‏ مقياس الأداء: 

إن نظام BPM‏ هو نظامٌ لقياس الأداء. ووفقًا U‏ ذكره )2002( lS Simons‏ نُظُّم قياس الأداء؛ هي: 
«مساعدة المديرين في متابعة LAS‏ إستراتيجية الأعمال؛ من خلال مقارنة النتائج الفعلية بالأهداف 
والغايات الإستراتيجية» Goles‏ ما يشتمل نظام قياس الأداء على طرق منهجية لتحديد أهداف العمل 
مع تقارير ردود الأفعال الدورية التي تشير إلى التقدم في تحقيق الأهداف» (ص .)٠١۸‏ 

الجديرٌ بالذكر أن كل أنظمة القياس تدور حول المقارنات. ونادرًا ما تكون الأرقام AYI‏ ذات 
قيمة. فإذا تم إخبارك ob‏ أحد مندوبي المبيعات قد أكمل X0*‏ من الصفقات التي كان يعمل عليها 
خلال شهر واحد؛ فلن يكون لذلك أي معنى يُذگر. ولنفترض الآن أنه 63 إخبارك بأن الشخص نفسه 
الذي قام بالمبيعات لديه معدل إغلاق شهري بنسبة <۳١‏ في العام الماضي. فالظاهر أن هذا الاتجاه 
جيد. ولكن ماذا لو K‏ إخبارك أيصًا ob‏ معدل الإغلاق اليومي لجميع مندوي المبيعات في الشركة 
كان SA-‏ وقتها يظهر لك أن مندوب مبيعات معين يحتاج إلى زيادة السرعة. وكما يُوحي تعريف 
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98 لقياس الأداء؛ فإن المقارنات الرئيسية تدور حول الإستراتيجيات والأهداف والغايات. 
وعادةٌ ما GAS‏ المقاييس التشغيلية المُستخدّمة لقياس الأداء. مؤشرات الأداء الرئيسية (KPIS)‏ 


مؤشر الأداء الرئيسي (KPI)‏ 
هناك اختلاف بين مقياس «تشغيل مصنع» ومقياس «الانحياز الإستراتيجي»» وغالبًا ما يُستخدّم 

مصطلح مؤشر الأداء الرئيسي (KPI)‏ للدلالة على ا لمصطلح الأخير (الانحياز الإستراتيجي). dig‏ 

مؤشر الأداء الرئيسى هدقًا ral al‏ ويقيس الأداء di lio‏ بالهدف. ووفقًا مما ذكره Eckerso‏ 

(2009)؛ فإن مؤشرات الأداء الرئيسة تكون متعددة الأبعاد. تحمل عدَّة معان وهذا يعني أن 

مؤشرات الأداء الرئيسة لها Bde‏ مميزات متنوعة وتتضمّن: i‏ 

- إستراتيجية: حيث تجسّد مؤشرات الأداء الرئيسة هدقًا إستراتيجيًا. 

- أهداف: فمؤشرات الأداء الرئيسية تقوم بقياس الأداء مقارنةٌ بالأهداف المُحدّدة؛ إذ يتم تحديد 
الأهداف في الإستراتيجية أو التخطيط أو جلسات الميزانيةء ويمكن أن تتخذ أشكالًا مختلفة (على 
سبيل JEL‏ أهداف الإنجازء وأهداف التخفيضء والأهداف المطلقة). 

- مجالات: حيث تحتوي الأهداف على مجالات أداء ule)‏ سبيل JULI‏ أعلى من الهدفء أو في 
صميم الهدفء أو dol‏ من الهدف). 

- ترميز: حيث يتم ترميز المجالات ف البرامج؛ مما يتيح العرض المرئي للأداء (على سبيل المثال: 
الأخضر, والأصفرء والأحمر). ويمكن أن يرتكز الترميز على النْسَب المئوية أو القواعد الأكثر تعقيدًا. 

- الأطر الزمنية: حيث يتم pbl iu‏ زمنية للأهداف التي يجب إنجازها. وكثيرًا ما يتم تقسيم 
الإطار الزمني إلى فواصل زمنية أصغر؛ من أجل الحصول على نقاط ميل منحنى الأداء. 

- المعايير: يتم قياس الأهداف وفقًا لخط الأساسء أو ا مؤشر ا مرجعي. وغالبًا ما تكون نتائج العام 
السابق بمثابة معيار» كما هكن Lái‏ استخدام أرقام عشوائية أو مؤشرات خارجية. 





Sources: Campbell, C. (2015). Top five differences between data lakes and data warehouses. www. 
blue-granite.com/blog/bid/402596/Top-Five-Differences-between-Data-Lakes-and-Data- Warehouses 
(accessed July 2016); Woods, D. (2011, July). Big Data requires a big, new architecture. Forbes.www.forbes. 
comf/sites/ciocentral/2011/07/21/big-data-requires-a-big-new-architecture/1598623291d75 (accessed 
August 2016); Dixon, J. (2010). Pentaho, Hadoop, and data lakes. James Dixon's Blog.https://jamesdixon. 
wordpress.com/2010/10/14/pentaho-hadoop-and-data-lakes/(accessed August 2016); Dull, T. (2016). 
Data lake vs data warehouse: Key differences. KDnuggets.com. http://www.kdnuggets.com/2015/09/data- 
lake-vs-data-warehouse-key-differences.html (accessed August 2016). 
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الفصل الثالث 


في بعض الأحيان يتم Sall‏ بين مؤشرات الأداء الرئيسة التي يُقصّد بها «النتائج» وتلك التي 
LA‏ بها «الدوافع»؛ فنتائج مؤشرات الأداء الرئيسة - التي تُعرف أحيانًا بمؤشرات التباطؤ - تقيس 
النتائج التي وصل إليها النشاط السابق (مثل: الإيرادات). فهي في الغالب مالية بطبيعتهاء غير 
أن هذا ليس بشكلٍ دائم. وتُحدّد دوافع مؤشرات الأداء الرئيسة - والتي تعرف أحيانًا با مؤشرات 
الرئيسة أو محركات القيمة - الأنشطة التي لها تأثيرٌ كبيرٌ على مؤشرات الأداء الرئيسة للنتائج 
(مثل: العملاء المحتملون للمبيعات). 
allis‏ على مؤشرات الأداء الرئيسية (KPIS)‏ في بعض الدوائر أحيانًا اسم KPIs‏ التشغيلي 
وهو من التناقض اللغوي )2008 (Hatch,‏ وتقوم معظمٌ المؤسسات بجمع مجموعة واسعة من 
المقاييس التشغيلية. وكما يوحي الاسم؛ فإن هذه المقاييس تتعامل مع الأنشطة التشغيلية وأداء 
الشركة. وتُوضْح الأمثلة التالية تنوع مجالات التشغيل التي تغطيها هذه المقاييس: 
- أداء العميل: مقاييس لرضا العملاء وسرعة ودقة UKALI Jo‏ والاحتفاظ بالعملاء. 
elol -‏ الخدمة: مقاييس معدلات دقة اتصال الخدمةء ومعدلات تجديد الخدمة» واتفاقيات 
مستوى doad]‏ وأداء التسليم» ومعدلات الإرجاع. 
- عمليات المبيعات: حسابات جديدة على وشك الحدوثء واجتماعات المبيعات المضمونة, 
وتحويل الاستفسارات إلى العملاء المتوقعين» ومتوسط وقت إغلاق ADU‏ 
- خطة المبيعات/ التوقعات: مقاييس دقة أسعار الشراء» ونسبة الشراء إلى معدل التنفيذ 
والكمية ا محققةء ونسبة توقعات الخطةء وإجمالي العقود المغلقة. 
وسواءٌ أكان المقياس التشغيلي إستراتيجيًا أم Y‏ فإن ذلك يعتمدٌُ على الشركة ومدى استخدامها 
للمقياس. وف العديد من الحالات؛ فإن هذه المقاييس تمثل الدوافع الرئيسة للنتائج الإستراتيجية, 
فعلى سبيل JELU‏ تذكر )2008( Hatch‏ حالة Ejga‏ نبيذ من الدرجة المتوسطة تم تقليصه في 
المراحل الأولى من خلال e$‏ الموزدين وتياره من خلال ea‏ تجار التجزئة. ورذًا على ذلك؛ 
قزرت التركيز على أربعة إجراءات تشغيلية: تعزيز ss‏ المخزون المتاح/ في الوقت eral]‏ 
وقيمة الطلبات «المفتوحة» diis]‏ والحسابات الجديدة الصافيةء وتكاليف الترقية والعائد على 
الاستثمار في التسويق. وقد كانت النتيجة الصافية لجهودها زيادة بنسبة ×1١‏ في الإيرادات في 
عام واحد. ومن الواضح أن هذه المقاييس التشغيلية كانت مُحركات رئيسة. ومع ذلك؛ وكما 
m‏ مُوضّح في القسم التالي؛ فإن الشركات في كثير من الحالات» تقوم ببساطة بقياس ما هو ملائم 
مع الحدٌ الأدنى مع النظر في سبب جمع البيانات. وتكون النتيجة إهداراً للوقت والجهد والمال. 


Ye‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


نظام قياس الأداء: 

يُوجَّد فرق بين نظام قياس الأداء ونظام إدارة الأداء؛ إذ يشتمل الأخير (نظام إدارة الأداء) على 
الأول (نظام قياس الأداء). (ol‏ نظام إدارة shol‏ يحتوي على نظام قياس clol‏ والعكس غير صحيح. 
وإذا كنت ست سأل؛ فإن معظم الشركات اليوم تدعي أنها تمتلك نظامًا لقياس الأداء؛ ولكن ليس 
بالضرورة نظام إدارة clol‏ على الرغم من أن نظام قياس الأداء لا يُستخدّم إلا قليلاً dde‏ وإن S325‏ 
فيكون بدون الهيكل الشامل لنظام إدارة الأداء. 

dad‏ أنظمة قياس الأداء الأكثر شيوعًا ed al‏ هي بعض أشكال بطاقة الأداء المتوازنة 
من Kaplan‏ و(850) Norton‏ وتشيرٌ دراسات المقارنة والاستطلاعات المختلفة إلى أن نسبة 
الشركات التي نفذت XS a‏ من أشكال BSC‏ في وقت أو آخر تتراوح بين 0۰> إلى أكثر من dU‏ 
isl‏ مكان. وعلى الرغم من أن هناك بعض الغموض حول ما يُشكل (التوازن)» غير أنه لا يُوجَد 
dol‏ شك حول مُنشَئَيْ BSC‏ وهما: Kaplan‏ و(1996) Norton‏ واللذين ذكرا أن: «المركزية 
لمنهجية 850 هي رؤية شاملة لنظام القياس المرتبط باتجاه المنظمة الإستراتيجي. والتي تستند 
إلى أربع وجهات نظر من منظور kloll‏ مع تدابير مالية ذاتيةء ومدعومة من قبل العملاء؛ إضافةٌ 
إلى مقاييس التعلّم والنمو». 


أسئلة مراجعة على القسم :٠١-‏ 

-١‏ ما هي eii‏ إدارة الأداء؟ ولماذا نحتاج إلى أحدها؟ 

3KPI ما هي السّمات المميّزة لمؤشرات‎ -Y 

-Y‏ اذكر مع التوضيح بإيجاز مجالات التشغيل الأربعة الأكثر شيوعًا لمؤشرات الأداء الرئيسية. 
£- ما هو نظام قياس الأداء؟ وكيف يعمل؟ 


١١-“‏ بطاقات الأداء المتوازنة: 

لعل أوسع أنظمة إدارة الأداء شهرةً وأكثرها استخدامًا على نطاق واسع؛ هو بطاقة الأداء 
المتوازن .(BSC)‏ وقد أوضح کل من Nortons Kaplan‏ هذه المنهجية لأول مرة في مقالهما 
-المنشور في Harvard Business Review‏ عام 1551م - وكان عنوان هذه المقالة: «بطاقة الأداء 
المتوازن: المقاييس التي تدفع الأداء». وبعد مرور بضع سنوات» وتحديدًا في عام ٦۱۹۹م‏ أصدر 
هذان المؤلفان GS‏ رائدًا بعنوان - بطاقة الأداء المتوازن: ترجمة الإستراتيجية إلى فعل - والذي 
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الفصل الثالث 


33s‏ كيف كانت الشركات تستخدمٌ BSC‏ ليس فقط لتكمّل إجراءاتها المالية مع المقاييس غير 
AJU‏ ولكن Léi‏ لتوصيل وتنفيذ إستراتيجياتها. وعلى مدى السنوات القليلة الماضية أصبحت 
BSC‏ مصطلحًا edat 15 le‏ لتمثيل كل نوع من أنواع تطبيق الأداء والتنفيذء بغض النظر 
e‏ إذا كان متوازنًا أو إستراتيجيًا. yg‏ على هذا الاختلاف حول المصطلح؛ فقد أصدر JS‏ من 
Nortons Kaplan‏ كتابًا جديدًا في عام ١٠۲۰م‏ بعنوان: المنظمة التي ترگز على الإستراتيجية: 
كيف تزدهر شركات بطاقات الأداء المتوازن في بيئة الأعمال الجديدة وقد تمّ تصميم هذا الكتاب 
لإعادة التأكيد على الطبيعة الإستراتيجية لمنهجية BSC‏ وتبع ذلك ببضع سنوات» في عام «Y^‏ 
بخرائط الإستراتيجية: تحويل الأصول غير الملموسة إلى نتائج ملموسة» والتي تصف عملية 
مُفصّلة لربط الأهداف الإستراتيجية بالتكتيكات والمبادرات التنفيذية. als‏ جاء كتابهم الأخير 
The Execution Premium‏ والذي نُشر في Yel:‏ ویرگز على الفجوة الإستراتيجية التي 
تربط بين صياغة الإستراتيجية والتخطيط والتنفيذ التشغياي. 


وجهات النظر الأربعة: 
تشيرٌ بطاقة النتائج المتوازنة إلى Ua‏ ننظر إلى المنظمة من أربعة منظورات» وهي: 
-١‏ العملاء. 
-Y‏ العمليات اطالية. 
"- عمليات الأعمال الداخلية. 
ع- التعلم والنمو. 


إضافةً إلى تطوير الأغراض. والمقاييسء والأهدافء والمبادرات المتعلقة بكل منظور من هذه المنظورات» 
auis‏ الشكل ٠١-۳‏ هذه المنظورات الأربعة وعلاقاتها المتداخلة مع رؤية المنظمة وإستراتيجيتها. 

- منظور العملاء: أدركت فلسفاث الإدارة الحديثة الأهمية الكبيرة للتركيز على العميل ومدى 
رضاه في أيّ Jae‏ تجاري. وفيما يلي المؤشرات الرئيسة لقياس ذلك؛ فالعملاء إذا م يشعروا بالرضا؛ 
فإنهم في الواقع سوف يبحثون عن مورّدِين آخرين هكنهم تلبية احتياجاتهم. وبالتالي؛ فإن الأداء 
الضعيف من هذا المنظور dd‏ مؤشرًا ss‏ على التراجع في المستقبل» على الرغم من أنَّ الصورة 
à LUI‏ الحالية قد تبدو جيدة. ds‏ تطوير المقاييس لتحقيق الرضا؛ ينبغي تحليل العملاء من 
حيث أنواع العملاء وأنواع العمليات التي ea‏ لها منتجًا أو خدمةً لتلك المجموعات من العملاء. 


vv‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


- ا منظور المالي: م يتجاهل ds‏ من Nortons Kaplan‏ الاحتياجات التقليدية للبيانات AUI‏ 
ولذلك؛ Ó‏ الأولوية Glo‏ ستكون لتقديم بيانات التمويل بشكل دقيق» وفي الوقت المناسب» 
وسوف Jig‏ المديرون US‏ ما في وسعهم لتوفير هذه البيانات. وف الواقع؛ فإنه غالبًا ما يكون 
هناك أكثرٌ من معالجة كافية لتجهيز البيانات المالية. ومع تنفيذ قاعدة بيانات الشركات؛ فإنه 
من المنتظر أن تتمّ معالجة المزيد من البيانات المالية وبطريقة تلقائية. لكن تبقى هناك نقطة 
مهمة في هذا الأمرء وهي أن التركيرٌ الحالي على الأمور المالية يؤدي إلى الوَضّع «غير المتوازن» فيما 
يتعلق بالمناظير الأخرى. فقد تكون هناك حاجةٌ لإدراج بيانات إضافية مرتبطة بالقطاع المالي في 
هذه الفئةء مثل: بيانات تقييم المخاطر والفوائد من حيث التكلفة. 


- منظور التعلم والنمو: يهدف هذا المنظور إلى الإجابة عن سؤال «كيف سنحافظ على قدرتنا 
على التغيير والتحسين؛ من أجل تحقيق رؤيتنا؟». وهذا يتضمّن تدريب ا موظفين وإدارة المعرفة 
والخصائص الثقافية للشركات المتعلقة بالتحسينات الفردية والجماعية على S6‏ سواء. ds‏ المناخ 
الحالي للتغ بر التقني السريع؛ أصبح من الضروري أن يكون العاملون في مجال العرفة في وضع 
التعلّم والتطور المستمر. ويمكن وَضْعِ مقابيس لتوجيه المديرين إلى تركيز الموارد المالية المخصصة 
للتدريب؛ إذ يمكنهم المساعدة أكثر. deg‏ أية حال؛ فإن التعلم والنمو يشكّل الأساس الجوهري 
لنجاح isl‏ منظمة عاملة في مجال المعرفة. ويؤكد JS‏ من Nortons Kaplan‏ أن «التعلم» أكثر 
من كونه «تدريباً» فهو إضافةٌ إلى التدريب يتضمّن Ul‏ أشياء مثل وجود الموجُهين والمعلمين 
داخل ابمنظمة؛ flal‏ إلى سهولة التواصل بين العمال؛ مما يسمح لهم بالحصول على مساعدة 
بشأن (sl‏ مشكلة عند الحاجة إلى ذلك. 

- منظور عملية الأعمال الداخلية: ويركز هذا المنظور على أهمية العمليات التجارية؛ إذ 
تسمح المقاييس التي تستند إلى هذا المنظور للمديرين بمعرفة مدى جودة تشغيل عملياتهم 
ووظائفهم الداخليةء وما إذا كانت نتائجٌ هذه العمليات ssl)‏ المنتجات والخدمات) تلبِّي وتتجاوز 
متطلبات العملاء (المهمة). 
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شكل 8-"1: أربع وجهات نظر في منهجية بطاقة النتائج المتوازنة 


معنى التوازن فى :BSC‏ 
من وجهة نظر عالية المستوى؛ فإن بطاقة الأداء المتوازن (BSC)‏ 45 مقياسًا للأداء ومنهجيةٌ 
إدارة تساعد في ترجمة الأوضاع JUI‏ للمؤسسة: والعملاء والعمليات الداخليةء إضافةٌ إلى 
أهداف التعلّم والنموٌ إلى مجموعة من المبادرات القابلة للتطبيق. وباعتبار بطاقة الأداء المتوازن 
(BSC)‏ منهجية للقياس؛ فقد G3‏ تصميمها لتجاوز القيود المفروضة على الأنظمة التي تركّز على 
الناحية المالية. وتقوم هذه المنهجية بذلك عن طريق ترجمة رؤية المنظمة وإستاتيجيتها إلى 
مجموعة من الأهداف والتدابير والمبادرات JUL‏ وغير امالية اللترابطة. 
وتندرج الأهداف غير اطالية à‏ واحدة من ثلاث وجهات نظر: 
- العميل: dod‏ هذا الهدف كيف يجبٌ أن تظهر المنظمة لعملائها إذا أرادت تحقيق رؤيتها. 
- عملية الأعمال الداخلية: odaga‏ هذا الهدف العمليات التي يجبٌ أن تتفوق فيها ا مؤسسة 
لإرضاء مساهميها وعملائها. 
els :‏ والنمو: يوضّح هذا الهدف كيف هكن لمنظمة ما تحسين قدرتها على التغيير والتحسين؛ 
من أجل تحقيق رؤيتها. 
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التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


وفي الأساس؛ فإن الأهداف غير المالية تشكّل lanas deae lulu‏ مع «التعلم والنمو»؛ مما 
يؤدي إلى تغيير «عملية العمليات التجارية الداخلية» والتي تنتج نتائج «العميل» وا لمسؤولة 
عن تحقيق الأهداف «JU»‏ للشركة. وفي BSC‏ ينشأ مصطلح التوازن؛ لأن مجموعة التدابير 
مجتمعة من المفترض أن تشمل المؤشرات: 
- امالية وغير المالية. 
- الرائدة والمتخلفة. 
- الداخلية والخارجية. 
- الكمية والنوعية. 
- على المدى القصير والمدى الطويل. 


أسئلة مراجعة على القسم MY‏ 

33b ما هي بطاقة الأداء المتوازن (850)؟ ومن أين‎ -١ 

-Y‏ ما هي المناظير الأربعة التي تقترحها (BSC)‏ لعرض الأداء التنظيمي؟ 

-Y‏ مماذا نحتاج إلى تحديد مقاصد ومقاييس وأهداف ومبادرات منفصلة JS‏ من وجهات النظر 
الأربعة هذه؟ 

-E‏ ما هو معنى التوازن في SBSC‏ وما هو تحفيز ذلك التوازن؟ 

0- ما هي أوجه الشبه والاختلاف بين لوحات المعلومات وبطاقات الأداء؟ 


٧۲-٣۳‏ ستة سيجما كنظام لقياس الأداء: 

dia‏ إنشاء ستة سيجما في منتصف الثمانينيات» وهي تتمتّع بانتشار واسع النطاق بين الشركات 
في جميع أنحاء العالم. ومن الجدير بالذكر؛ أن معظم الشركات م تستخدمها كمنهجية قياس الأداء 
والإدارة؛ بل أستُخدمَتْ ao‏ من ذلك كمنهجية لتحسين العمليات؛ إذ oS‏ الشركات من التدقيق 
في عملياتها وتحديد المشكلات وتطبيق العلاجات. وفي السنوات الأخيرة أقرّت بعض الشركات» 
مثل Motorola‏ بقيمة استخدام ستة سيجما لأغراض إستراتيجية؛ إذ توفر ستة سيجما في هذه 
الحالة الوسائل لقياس ومراقبة العمليات الأساسية المتعلقة بربحية الشركة؛ وتسريع التحسّن في 
الأداء العام للأعمال. ونظرًا لتركيزها على العمليات التجارية؛ OB‏ ستة سيجما s‏ أيضًا Ais o‏ 
مباشرةٌ لمعالجة مشكلات الأداء بعد تحديدها أو اكتشافها. 
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الفصل الثالث 


os‏ سيجما )0( Sigma‏ بأنها حرف في الأبجدية اليونانية يستخدمه الإحصائيون لقياس 
التباين في العملية. وفي مجال الجودة يكون fl‏ مرادفًا لعدد العيوب. وبشكل عام؛ فقد 
قبلت الشركات قدرًا eS‏ من التباين في عملياتها التجارية. ls‏ من الناحية العددية؛ فقد كان 
المعيار 77٠١‏ إلى 77٠٠١‏ عَثْب لكل مليون فرصة (DPMO)‏ فعلى سبيل المثال: إذا كانت شركة 
تأمين تتعامل مع مليون شكوى؛ فإن إجراءات التشغيل العادية من 77٠١‏ إلى 1۷٠٠١‏ من هذه 
الشكاوى nena A5‏ (أيْ: يتم التعامل معها بشكل غير صحيح» وتحتوي على أخطاء في النماذج). 
هثل هذا امستوى من التباين مستوى أداء من ثلاثة إلى أربعة Sigma‏ ولتحقيق مستوى أداء 
ستة alò Sigma‏ سيكون على الشركة تقليل عدد العيوب إلى ما لا يزيد عن .DPMO ١,6‏ 
ولذلك؛ فإن ستة سيجما عبارة عن منهجية لإدارة الأداء تهدف إلى تقليل عدد العيوب في العمليات 
التجارية إلى أقرب ما يكون إلى الصفر من DPMO‏ قدر الإمكان. 


نموذج الأداء :DMAIC‏ 


تقع ستة سيجما على نموذج بسيط لتحسين ell‏ يُعرّف باسم DMAIC‏ ويشبه 35d‏ 
DMAIC‏ هذا موذج BPM‏ فكلاهما نموذج لتحسين الأعمال في حلقة Ae As‏ وهو يشمل 
خطوات تحديد وقياس وتحليل وتحسين والتحكُم في العملية. ويمكن وَصْف الخطوات على 

النحو التالي: 

-١‏ تعريف: Laig‏ بذلك تحديد مقاصد وأهداف وحدود blis‏ التحسين. وعلى المستوى الأعلى؛ 
فإن الأهداف يُقصّد بها الأهداف الإستراتيجية للشركة. وف المستويات الأدنى (مستويات 
الإدارة أو المشروع)؛ فإن الأهداف تركز على عمليات تشغيلية مُحدّدة. 

-Y‏ قياس: à as‏ به قياس النظام الحالي. بمعنى à‏ مقاييس كمية من شأنها أن تُسفر 
عن بيانات صحيحة filas!‏ بحيث يمكن استخدام البيانات؛ لمراقبة PAANI‏ نحو الأهداف 
المحدّدة في الخطوة السابقة. 

-Y‏ تحليل: alis‏ به ales‏ النظام لتحديد سُبْل القضاء على الفجوة بين الأداء الحالي للنظام أو 
العملية والهدف المنشود. 

-٤‏ تحسين: X alis‏ به الشروع في إجراءات للقضاء على الفجوة من خلال إيجاد طرق لفعل 
Js a c aj‏ أفضل وأسرع وأقل تكلفة. ويتمُ ذلك باستخدام إدارة المشاريع وأدوات 
التخطيط الأخرى لتنفيذ الهج الجديد. 
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التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


0- التحكّم: ويُقصّد بذلك iliaj‏ الطابع المؤسسي على النظام بعد تعديله؛ من خلال تعديل 
أنظمة التعويض والحوافز والسياسات والإجراءات» وتخطيط موارد التصنيع وموارد الميزانيات 
وتعليمات التشغيل أو أنظمة الإدارة الأخرى. 
وبالنسبة للعمليات الجديدة؛ فإن نموذج DMADV‏ المُستخدّم ل (التعريفء والقياس» 

والتحليلء والتصميم. والتحقيق) يُعَذ نموذجًا Gala‏ ولذلك؛ فقد $3 استبداله ب DMAIC‏ 

غير أن DMADV‏ لا يزال يُُستخدّم في المقام الأول مع القضايا التشغيليةء ومع ذلك؛ فلا شيء 

هنع تطبيق هذه المنهجيات. ففي السنوات الأخيرةء كان هناك تركيرٌ على الجمع بين منهجية 

ستة سيجما وغيرها من المنهجيات الناجحة. فمثآا Q3‏ دَمْج المنهجية المعروفة باسم Lean‏ 

Manufacturing‏ أو Lean Production‏ أو ببساطة باسم Lean‏ مع ستة سيجما؛ لتحسين 





تأثيرها في إدارة الأداء. 


بطاقة الأداء المتوازن مقابل ستة سيجما: 


على الرغم من قيام الكثيرين بالجمع بين ستة سيجما وبطاقات قياس متوازنة؛ من أجل 
الحصول على حل أكثر شمولية؛ Oh‏ بعضهم رز على تفضيل إحداها على الأخرى. وقد pS‏ 
Gupta (2006)‏ في كتاب له بعنوان: « ستة سيجما «Business Scorecard‏ ملخصًا IÁ‏ 
للاختلافات بين بطاقة الأداء امتوازنةء ومنهجيات ستة سيجما (انظر: الجدول (V-Y‏ وباختصار؛ 
فإن الفرق الرئيس يتمثل في BSC ol‏ ترز على تحسين الإستراتيجية العامة؛ في حين ترز ستة 
سيجما على تحسين العمليات. 


جدول :V-Y‏ مقارنة بين بطاقة الأداء المتوازن وستة سيجما 





بطاقة قياس الأداء المتوازن ستة سيجما 
نظام الإدارة الإستراتيجية نظام قياس الآداء 


à‏ تقدّم لقطةً لأداء الأعمالء os‏ 33 التدابير الت 
gies‏ بالعرض الطويل الأجل للأعمال di E E Mo‏ 
تدفع الأداء نحو الرّبحية 

مُصمّمة لتحديد مجموعة من القياسات التي تؤثر 


Ao على‎ 


مُصمّمة لتطوير مجموعة متوازنة من التدابير 
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> 


SX oS‏ المساءلة عن القيادة؛ من أ- 


والرّبحية 





]| الصحة 


بطاقة قياس الأداء المتوازن 
تُحدّد القياسات حول الرؤية والقيم 


تتمثل عمليات الإدارة الحاسمة في توضيح الرؤية/ 





تشمل جميع العمليات التجارية: الإدارية 
والتشغيلية 


الإستراتيجية. والتواصلء والتخطيطء وتحديد 
الأهداف» ومواءمة المبادرات الإستراتيجيةء وتعزيز 
التغذية 855,4 





أرصدة الإدارة وأدوار الموظفينء وأرصدة تكاليف 
وعائدات العمليات الثقيلة 

تؤكّد على مُعدَّل التحفيز القوي US)‏ قياس؛ بغ 
النظر عن تحقيق كمية المبيعات المُستَهدّفة 

aS‏ على التعلم والابتكار على جميع المستويات 
zo‏ على التغذية BIA‏ ويستلزم مشاركة جميع 


الموظفين 
تركز على تعظيم الرّبحية 


ضخمة عند التنفيذ للربحية 





نظام القياس على أساس إدارة العملية 





أرصدة العملاء والعمليات الداخلية دون دور 
pl‏ واضح deli‏ 

تكد على تحقيق كمية مبيعات مُستَهدّفة لكل 
قياس 


oS‏ على elus‏ المديرين التنفيذيين على أساس 
التغذية 855,U‏ 

ترگز على soil‏ 

ضخمة بالنسبة للمحتوى الإستراتيجي 


نظام إدارة يتكوّن من التدابير 








Source: Gupta, P. (2006). Six Sigma business scorecard, 2nd ed. New York: McGraw-Hill Professional. 


قياس الأداء الفعّال: 


Sae på iy‏ من الكتب الطرق التي تُحدّد ما إذا كانت مجموعة من مقاييس الأداء جيدةٌ أم 
سيئة. ومن بين الصفات الأساسية التي تميّز مجموعة مقاييس الأداء الجيدة ما يلي: 
- ينبغي أن 5 المقاييس على العوامل الرئيسية. 
- يجب أن تكون المقاييس Uu ja‏ من الماضي والحاضر والمستقبل. 
- يجب أن ثوازن المقاييس بين احتياجات المساهمين والموظفين والشركاء والمورّدين وأصحاب 
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المصلحة الآخرين. 


FA 


التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


- يجب أن lus‏ الإجراءات من الأعلىء ثم تتدفق إلى الأسفل. 
- يحتاجُ القياس أن يكون له كمية مبيعات مس تَهدّفة (هدف يسعى إلى تحقيقه) والتي تستند 
إلى البحث والواقع وليست تعسّفية. 

كما يُلاحِظ القسم المتعلّق بمؤشرات الأداء الرئيسية أنه على الرغم من أهمية جميع هذه 
الخصائص؛ فإن المفتاح الحقيقي لنظام قياس الأداء JURA‏ هو وجود إستراتيجية جيدة. فيجبٌ 
اشتقاق المقاييس من إستراتيجيات وحدة الشركات والأعمالء ومن تحليل العمليات التجارية 
الرئيسية المطلوبة لتحقيق تلك الإستراتيجيات. وبطبيعة الحال؛ فالقول أسهل من الفعل. فلو 
كانت بسيطةٌ؛ فإن معظم المنظمات لديها بالفعل أنظمةٌ AUS‏ لقياس الأداء غير أنها لا تقوم بذلك. 





pá ig‏ الحالة العملية (1-Y)‏ - والتي تصف نظام بطاقة الأداء على أساس KPI‏ المستند 
إلى الويب على Expedia.com‏ - نظرةٌ ثاقبة على الصعوبات المتعلقة بتحديد S‏ من نتائج 
ومؤشرات KPI‏ وأهمية مواءمة مؤشرات الأداء الرئيسة للإدارات مع الأهداف العامة للشركة. 


حالة عملية VY‏ 
بطاقة درجة رضا العملاء الخاصة ب Expedia.com‏ 
35 شركة Expedia, Inc‏ هي الشركة الأم لبعض الشركات العاممية الرائدة في مجال 
السياحة؛ إذ تقدِّم خدمات السفر للمسافرين بغرض الترفيه» والمقر الرئيسي لهذه الشركة 
هو الولايات المتحدة الأمريكية. كما Ol‏ لها فروعًا أخرى في مختلف دول العام. وهي 
تمتلك وتدير مجموعةً متنوعةً من العلامات التجارية Us «355 sl‏ في Expedia. «U5‏ 
Classics .Egencias «TripAdvisor, .Hotwire.comg .Hotels.coms «com‏ 
5 ومجموعة من الشركات dabl‏ والدولية الأخرى. وتحتوي عروض سفر 
الشركة على: رحلات شركات الطيران» والإقامة في الفنادقء واستئجار السيارات» وخدمات 
أماكن الوصولء والرحلات البحريةء ورحلات السفر التي تقدّمها مختلف شركات الطيران؛ 
إضافة إلى أماكن الإقامةء وشركات تأجير السيارات» والخدمات التي eS‏ في مكان 
الوصول» وخطوط الرحلات البحريةء وغيرها من شركات خدمات السياحة القائمة بذاتها 
و التي تعمل في مجموعة. كما Ji a3 lil‏ حجز غرف الفنادق ومقاعد شركات الطيران 
وتأجير السيارات. وخدمات الوصول ال مقدّمة من الشركات السياحية. وتعمل هذه 
الشركة كوكيلٍ في الإجراءات؛ إذ تقوم بالحجز للمسافرين على شركة الطيران أو GLA‏ 
أو شركات تأجير السيارات أو خطوط الرحلات. وتجعل هذه العلامات التجارية المشهورة 
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الفصل الثالث 


مع الأعمال التجارية المبتكرة من Expedia‏ أكبر وكالة سفر عبر الإنترنت في العام وهي 
ثالث أكبر شركة سفر في الولايات المتحدة, ورابع أكبر شركة سفر في العالم. وتتمثل مهمثها 
في أن تصبح أكبرَ وأكثر شركة سياحية io ja‏ في العالم؛ وذلك من خلال مساعدة الجميع 
في ÍS‏ مكان في التخطيط وتوفير ÍS‏ ما يتعلق بخدمات السياحة والسفر. 

امشكلة: 


d s‏ رضا العملاء هو المفتاح JS‏ مهام وإستراتيجيات؛ بل وأساس نجاح شركة 
Expedia‏ ونظرًا لأن خدمة البيع بالتجزئة هي blis‏ تجاريٌ عبر الإنترنت؛ فإن تجربة 
تسوق العميل 355 أمرًا بالغ الأهمية لإيرادات شركة Expedia‏ إذ إن تجربة B all‏ 
عبر الإنترنت ise‏ أن تجعل النشاط التجاري عبر الإنترنت يزدهر أو ينتهيء ومن امهم 
أيضًا أن توج تجربة التسوق للعميل برحلة جيدة. ونظرًا لأن تجربة العميل hal i‏ 
بالغ الأهمية؛ فإنه يجبُ gis‏ جميع مشكلات العملاء ومراقبتها los‏ في أسرع às‏ 
ممكن. وللأسف؛ فقد كانت شركة Expedia‏ قبل بضع سنوات لا تستطيع الوصول إلى 
«رأي العميل». فلم يكن لديها طريقة موحّدة لقياس مدى رضا العميلء أو تحليل 
محركات الرضاء أو تحديد أثر الرضا على ربحية الشركة أو أهداف العمل العامة. 

الحل: 

مم تكن مشكلة شركة Expedia‏ تتمثل في نقص البيانات. أدركت المجموعة المسئولة 
عن قياس مدى رضا العملاء في شركة Expedia‏ أن لديها الكثير من OBLI‏ وبشكلٍ 
عام؛ فقد كان هناك Y»‏ قاعدة بيانات متباينة مع ۲۰ مالگا مختلقًا. ومن ثمّ قامت 
المجموعة بتكليف أحد los‏ أعمالها بمهمة تجميع البيانات من هذه المصادر المختلفة 
وتجميعها في 34e‏ من المقاييس الأساسية لقياس مدى الارتياح. وقد كان محلل الأعمال 
يقضي ما يقرب من أسبوعين إلى ثلاثة أسابيع JS‏ شهر في سحب البيانات وتجميعهاء 
وهذا الأمر مم يترك وقنّا للتحليل نهائيًا. ولذلك؛ فقد أدركت المجموعة في النهاية أن 
مجرد تجميع البيانات لم يكن كافيًا؛ إذ يجب أن يُنظر إلى البيانات في سياق الأهداف 
الإستراتيجيةء وكان يجب على الأفراد أن يضعوا أيديهم على النتائج. 

وممعالجة المشكلة قرَّرت المجموعة أنها بحاجة إلى رؤية راقية. ولذلك فقد بدأت 
بتحليل Lais‏ للدوافع الأساسية elo‏ الإدارة والرابط بين هذا الأداء وأهداف Expedia‏ 
الشاملة. ثم قامت المجموعة بعد ذلك بتحويل برامج التشغيل وهذه الارتباطات إلى 
بطاقة قياس أداء. وقد تضمّنت هذه العملية ثلاث خطوات: 
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التحليلات الوصفية :(Y)‏ ذكاء الأعمال ومستودعات البيانات 


-١‏ تقرير كيفية قياس مدى رضا العميل: وقد تطلّب ذلك من المجموعة تحديد أي 
من المقاييس في قواعد البيانات العشرين سيكون مفيدًا في إظهار مستوى Lo;‏ العميل, 
وقد أصبح هذا هو الأساس لبطاقات الأداء ومؤشرات الأداء الرئيسية. 

-Y‏ تحديد أهداف الأداء الصحيحة: liag‏ يتطلب من المجموعة تحديدّ ما إذا 
كانت أهداف KPI‏ لها أرباحٌ قصيرة الأجل أو طويلة الآجل؛ فمجرد رضا العميل عن 
تجربته عبر الإنترنت لا يعني بالضرورة أن العميل راض päh os‏ خدمة السفر. 

-Y‏ وضع البيانات في السياق: فقد كان على المجموعة رَبْط البيانات بمدى رضا 
العملاء في الوقت الحالي. 

وتم تغذية مصادر البيانات المختلفة بشكل فوري في قاعدة بيانات رئيسية (تُسمّى 
نظام دعم القرار). وفي حالة مجموعة الاستبيانات الخاصة بمدى رضا العملاء؛ فإن هذه 
الاستبانات تتضمّن إستطلاعات العملاء وأنظمة إدارة علاقات العملاء. وأنظمة الاستجابة 
الصوتية التفاعليةء وأنظمة خدمة العملاء الأخرى. ez:‏ تنزيل البيانات في DSS gias‏ 
بشكل (ass‏ في صورة عِدَّة مكعبات DMs‏ متعددة الأبعاد؛ بحيث هكن للمستخدمين 
الوصول إلى البيانات بطرق متنوعة ذات صلة باحتياجاتهم التجارية الخاصة. 

الفوائد: 

وفي نهاية المطاف استطاعت المجموعةٌ الخاصة من خلال قياس مدى رضا العملاء؛ 
أن تحقق من ٠١‏ إلى has as W‏ مباشرةً بمبادرات شركة إكسبيديا. وقد تم رَبْط هذه 
الأهداف بدورها بأكثر من 200 KPI‏ ضمن المجموعة الخاصة بقياس مدى رضا العملاء. 
يستطيع مالكو KPI‏ بناء وإدارة واستهلاك بطاقات الأداء الخاصة بهم كما هلك المديرون 
التنفيذيون ومديرو الإدارة رؤيةٌ filid‏ حول مدى توافق الإجراءات مع الإستراتيجية. كما 
توفر بطاقة النتائج للمجموعة الخاصة بقياس مدى رضا العملاءء القدرةً على التعمّق في 
البيانات التي 3455 وراء gl‏ من الاتجاهات أو الأنماط الملاحظة. J59‏ هذا كان يستغرق 
في الماضي أسابيع أو شهور للقيام به؛ وذلك إذا تم ELÄ‏ به على الإطلاق. ومكن ممجموعة 
خدمة العملاء معرفة مدى نجاحها في ما يتعلق بمؤشرات الأداء الرئيسية من خلال بطاقة 
doli]‏ والتي تنعكسٌ بدورها على أهداف المجموعة وأهداف الشركة. 

olla S‏ للبيانات الموجودة في النظام jea‏ إضافيةً؛ فهي لا تدعم فقط مجموعة 
رضا العملاء؛ بل إنها geas LÀ]‏ وحدات الأعمال الأخرى في الشركة. فعلى سبيل المثال: 
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هكن مدير الخط الأمامي tes‏ نفقات شركات الطيران على أساس JS‏ سوق على io‏ 
لتقييم أداء العقد المتفاوض عليه أو تحديد إمكانات التوفير لتوحيد الإنفاق مع شركة 
نقل واحدة. كما يكن مدير السفر الاستفادة من ذكاء الأعمال لاكتشاف المناطق التي 
بها كميات كبيرة من التذاكر غير المُستخدّمة أو الحجوزات غير المتصلة بالإنترنت ووضع 
إستراتيجيات لضبط السّلوك وزيادة التوفير العام. 

أسئلة للمناقشة: 

-١‏ مَنْ هم SExpedia.com eX as‏ وماذا ds)‏ رضا العملاء جزءًا مهما lág‏ من 
نشاطهم التجاري؟ 

-Y‏ كيف ساهم نظام البيع بالتجزئة في تحسين رضا العملاء باستخدام بطاقات الأداء؟ 

-Y‏ ما هي التحَدّيات؟ وما هو de)‏ المقترح؟ وما هي النتائج التي حصلوا عليها؟ 
Sources: Based on Microsoft. (2005). Expedia: Scorecard solution helps online travel‏ 
company measure the road to greatness. download.microsoft.com/documents/‏ 
customerevidence/22483_Expedia_Case_Study.doc (accessed June 2016); Editor's‏ 
note.(2004). Expedia incorporates customer satisfaction feedback and employee‏ 


input to enhance service and support. Quirks Marketing Research Media. http:// 
www.quirks.com/articles/3200420041001/.aspx (accessed July 2016). 


أسئلة مراجعة على القسم Y-Y‏ 

-١‏ ما هي ستة سيجما؟ وكيف يتم استخدامُها كنظام لقياس الأداء؟ 
-Y‏ ما هو 5821410 اذكر labg‏ بإيجاز لخطوات DMAIC‏ 

-Y‏ قارن بين BSC‏ وستة سيجما كنظامين متنافسين لقياس الأداء. 
-E‏ ما هي اللكوّنات اللازمة لنظام JUS‏ لإدارة الأداء؟ 


تلخيصٌ gaY‏ نقاط الفصل: 


- يعرف مستودع البيانات بأنه عبارة عن مستودع بيانات تمّ إنشاؤه بشكل خاص؛ إذ يتم تنظيم 
البيانات بحيث هكن للمستخدمين النهائيين الوصولٌ إليها بسهولة Bind‏ تطبيقات. 
- تحتوي DMS‏ على بيانات حول موضوع واحد (كالتسويق مثلا). يمكن أن يكون DM‏ نسخة 
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من مجموعة فرعية من البيانات في مستودع البيانات. DMs ad‏ حلا أقل تكلفةٌ هكن 
استبداله أو کن أن يكمل مستودع البيانات. كما هكن أن تكون DMs‏ مستقلةً عن أو تعتمد 
على مستودع البيانات. 

d s -‏ نظام ODS‏ نوعًا من قاعدة بيانات ملفات معلومات العملاء التي يتم استخدامها EJ‏ 
كمنطقة تقسيم لمستودع البيانات. 

alss das s -‏ البيانات ثلاث عمليات رثيسية» هى: الوصول إلى البياناتء واتحاد البيانات» 
والتقاط التغيير. فعندما يتم تنفيذ هذه العمليات الثلاث بشكل صحيح؛ هكن الوصول إلى 
البيانات وإتاحتها لمجموعة من ETL‏ وأدوات التحليل وبيئات مستودعات البيانات. 

- تقوم تقنيات ETL‏ بسحب البيانات من مصادر yas‏ وتطهيرهاء وتنزيلها في مستودع بيانات. 
illae ETL iiis‏ متكاملةً في Gl‏ مشروع يُركّ على البيانات بشكل فوري أو مستودعات البيانات 
النشطة التكميلية وتوسيع التخزين التقليدية للبيانات» والانتقال إلى مجال gió‏ القرارات 
التشغيلية والتكتيكية عن طريق تنزيل البيانات بشكل فوري وتوفير البيانات للمستخدمين 
لاتخاذ القرارات الفعّالة. 

isi -‏ أمان البيانات وا معلومات وخصوصيتها من الأمور المهمة بالنسبة للمتخصص في مستودع البيانات. 








مصطلحات أساسية: 

بطاقة النتائج المتوازنة | نمذجة الأبعاد الاستخراج والتحويل | الخطة التشغيلية 

(ETL) والتنزيل‎ (BSC) 

إدارة «lol‏ الأعمال | DMAIC‏ سوق البيانات المستقلة | نظم قياس الأداء 

(BPM) 

تكامل البيانات المكعب | الانتقال لأسفل مؤشر الأداء الرئيسي | مستودعات البيانات 
(KPI)‏ الفورية (RDW)‏ 

سوق البيانات (DM)‏ | تكامل تطبيقات | البيانات الوصفية ستة سيجما 

الشركات (EAI)‏ 
مستودع البيانات| مستودع بيانات | OLTP‏ مخطط مجموعة الثلج 
(DW)‏ امؤسسة (EDW)‏ 
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مدير مستودع البيانات | تكامل معلومات | سوق أوبر ا مخطط النجمي 
(DWA)‏ الشركات (EII)‏ 





(ODS) التشغيلية‎ 








مخزن الب E‏ 





سوق البيانات التابع il‏ الأبعاد 





أستلة للمناقشة: 

-١‏ قارن بين تكامل البيانات .ETLs‏ وكيف يرتبطان بعضهما ببعض؟ 

-Y‏ ما هو مستودع البيانات؟ وما هي فوائده؟ ويماذا Asi‏ إمكانية الوصول إلى الويب ago‏ في 

مستودع البيانات؟ 
- هل 954 ل DM‏ استبدالٌ مستودع البيانات أو استكماله؟ قارن وناقش هذه الخيارات. 
£- ناقش العوامل وامزايا الرئيسة لمستودعات البيانات للمستخدمين النهائيين. 
0- اذكر أوجه الاختلافات و/ أو الشبه بين أدوار مسؤول قاعدة البيانات ومسؤول مستودع البيانات. 
1 اشرح كيف هكن أن يؤدي تكامل البيانات إلى مستويات أعلى من جودة البيانات. 
-V‏ قارن بين طريقتيٰ Inmons Kimball‏ نحو تطوير مستودع البيانات. وحدّد متى يكون ÍS‏ 
منها ASÍ‏ فعالية. 

-A‏ ناقش المخاوف الأمنية المتعلقة ببناء مستودع البيانات. 

؟- قم بالتحقيق في تنفيذ تطوير مستودع البيانات الحالي من خلال النقل إلى الخارج. واكتب 
تقريرًا حول هذا الموضوع. ثم ناقش مع زملائك هذه القضية من حيث الفوائد والتكاليف» 
وكذلك العوامل الاجتماعية. 

-٠‏ يستخدم SAP‏ مصطلح إدارة المؤسسة الإستراتيجية (SEM)‏ ويستخدم Cognos‏ مصطلح 
إدارة أداء الشركات (CPM)‏ ويستخدم Hyperion‏ مصطلح إدارة slaf‏ الأعمال (BPM)‏ 
هل يشيرون إلى نفس الأفكار الأساسية؟ قَدَّم Dol‏ لدعم إجابتك. 

-١‏ يشمل BPM‏ خمس عمليات أساسية: ub‏ الإستراتيجية, التخطيط المراقبةء الفعلء والضبط. 
اختر إحدى هذه العمليات» وناقش أنواع أدوات البرامج والتطبيقات المتوفرة لدعمها. pii‏ 
الشكل ٠١-١‏ بعض التلميحات. ويمكنك أيضًا الاستعانة بقائمة الأدوات المساعدة الخاصة 
بشركة (Bain & Company (bain.com /management. tools /home.asp‏ 
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-AY‏ اختر شركةً عامة تهمك. باس تخدام التقرير السنوي للشركة لعام ١٠١۲م‏ قم بإنشاء ثلاثة 
أهداف مالية إستراتيجية لعام ۲۰۱۷م. لكل هدفه حَدَّد هدقًا أو Baa‏ إستراتيجيًا. يجب 
أن تكون الأهداف iaio‏ مع الأداء (JUL‏ للشركة لعام ١٠١۲م.‏ 

-P‏ قارن بين إدارة الأداء وقياس الأداء. 

-BSC قم بإنشاء إستراتيجية لشركة افتراضية؛ وذلك باستخدام وجهات النظر الأربع من‎ -٤ 
مع التعبير عن الإستراتيجية كسلسلة من الأهداف الإستراتيجية. ثم قم بِوَضْع خريطة‎ 
إستراتيجية تصؤر الروابط بين الأهداف.‎ 

5- قارن نموذج DMAIC‏ مع عمليات الحلقة المغلقة ل .BPM‏ 

-VI‏ اختر شركتين تعرفهما جيدًا. ما هي المصطلحات التي يستخدمونها لوضف مبادراتهم الخاصة 
ب BPM‏ وتركيبات البرامج؟ ثم قارن وميّز بين عروضهم من حيث تطبيقات ووظائف BPM‏ 


تمارين: جامعة تيراداتاء والتدريبات العملية الأخرى: 


DSS وامتاح على موقع‎ Coca-Cola Japan بالنظر في حالة تطوير مستودع بيانات لشركة‎ -١ 
1,3 .http;//dssresources.com/cases/coca-colajapan «o)l على‎ Resources 
الحالةجيدًا وأجب عن الأسئلة التسعة بمزيد من التحليل والمناقشة.‎ 

-Y‏ اقرأ مقال الكرة ))7٠١0(‏ وقم بترتيب المعايير (وفقًا لمنظمة حقيقية). في تقرير» اشرح مدى 


أهمية JS‏ معيار وماذا؟ 
-Y‏ اشرح متى يجب أن تقوم بتطبيق بنية ثنائية أو ثلاثية الطبقات عند التفكير في تطوير 
مستودع بيانات. 


-t‏ اقرأ حالة Continental Airlines‏ الكاملة (قصة نجاح تخزين بيانات شائعة للغاية) على 
شبكة Teradata university.com‏ وأجب عن الأسئلة. 

Harrah اقرأ وأجب عن الأسئلة المتعلقة بحالة ”أر باح‎ tteradatauniversitynetwork.com à-o 
ها ستستخدمه شركات الطيران‎ Harrah العالية من معلومات العميل“. ثم قم بربط نتائج‎ 
والكازينوهات الأخرى في بيانات العملاء.‎ 

teradatauniversitynetwork.com à‏ إقرأ الإجابة عن أسئلة المهمة ”فشل مستودعات 
البيانات“. ونظرًا YL OS‏ حالات موصوفة في هذه المهمة؛ فيمكن تقسيم الفصل إلى QU‏ 
مجموعات» مع تعيين حالة واحدة ds‏ مجموعة. lal‏ إلى ذلك؛ اقرأً Ariyachandra and‏ 
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ÍS 33-9 Watson )2006(‏ حالة كيف حدث aal‏ على أنه لا يرتبط بالتركيز على واحد 
أو أكثر من عوامل نجاح المرجع. 

۷- في teradatauniversitynetwork.com‏ اقرأ وأجب عن الأسئلة الخاصة ههمة «تقنية Ad-‏ 
:Vent‏ استخدام نموذج التحليل التحلياي ممبيعات .«MicroStrategy‏ يمكن الوصول إلى 
برنامج MicroStrategy‏ من موقع TUN‏ وقد ترغبٌ أيضًا في استخدام العرض التقديمي 
ل Barbara Wixom‏ حول برنامج MicroStrategy‏ «العروض التقدهمية للبرنامج (ài‏ 
««MicroStrategy Tutorial‏ والذي يتوفر أيضًا على موقع TUN‏ 

-A‏ في teradatauniversitynetwork.com‏ شاهد ندوات الويب التي تحمل عنوان: «مستودعات 
البيانات الفورية: الجيل التالي من إدارة بيانات دعم القرار» و«بناء المؤسسة بشكل فوري». 
ثم اقراً المقالة التي بعنوان: «البنية امرجعية للمؤسسات بشكل فوري في ترراداتا: مخطط 
لمستقبل تقنية المعلومات»» والتي تتوفر في هذا الموقع. وقم بوصف كيفية عمل المفاهيم 
والتقنيات الفوريةء وكيف يمكن استخدامها لتوسيع نطاق مستودعات البيانات الحالي وأبنية 
ذكاء الأعمال لدعم القرارات اليومية. واكتب تقريرًا يوضّح كيف أن RDW‏ تقدّم 55:5 
تنافسيةٌ للمؤسسات على وجه التحديد. ثم قم بوصف الصعوبات في Jia‏ هذه التطبيقات 
والعمليات بالتفصيل» ثم وصف كيفية معالجتها Éles‏ 

4- في teradatauniversitynetwork.com‏ شاهد ندوات الويب بعنوان: «النهوض بتكامل البيانات: 
برامج التشغيل الجديدة والمقاربة الناشئة» و«البحث عن نسخة واحدة للحقيقة: إستراتيجيات 
لتدعيم الصوامع التحليلية» و«دّمْج البيانات: استخدام ETL‏ و۴۸1 و۴11 أدوات لإنشاء مؤسسة 
متكاملة». واقرأ LAE‏ التقرير البحثي e»‏ البيانات». قارن بين العروض التقديمية. ما هي 
القضية الأكثر أهميةً التي تمّ وصفها في هذه الحلقات الدراسية؟ وما هي أفضل طريقة للتعامل 
مع الإستراتيجيات والتحَدَّيات الخاصة بتوحيد إدارة البيانات وجداول البيانات في بنية 83555 
لمستودعات البيانات؟ قم بإجراء بحب على الويب؛ للتعرّف على آخر التطؤرات في هذا ا مجال. 
ثم قارن العرض التقدهي SUL‏ في النص والمادة الجديدة التي عثرت عليها. 

-٠١‏ بالنظر في مستقبل مستودعات البيانات. قم بإجراء بحث على الويب حول هذا الموضوع. AR‏ اقرا 
هاتين المادتين: (31 Agosta, L. (2006, March‏ مستودعات البيانات في ble‏ مسطح: اتجاهات 
لعام :DM Direct Newsletter; and Geiger, J. G. (2005, November). CIFe —..Y**3‏ 
تتطور مع العصر. مراجعة .£1-YA DM‏ قارن وقارن نتائجك. 
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١‏ بالوصول إلى .teradatauniversitynetwork.com‏ حَدَّد أحدث OYALI‏ والتقارير البحثية 
وحالات مستودعات البيانات. مع CASS‏ التطورات الأخيرة في هذا المجال. اذكر في تقريرك؛ 
كيف ex‏ استخدامٌ مستودعات البيانات في ذكاء الأعمال و255. 

-\Y‏ انتقل إلى موقع YouTube.com‏ وابحث عن «حالات «BSI Teradata‏ ]3 تشير BSI‏ إلى 
Business Solutions Inc"‏ ". حَدد ثلاث حالات تخزين بيانات مثيرة للاهتمام» وشاهدها 
بعناية» واكتب تقريرًا لمناقشة النتائج التي توصّلت إليها حول مشكلات العمل واقتراحها 
الحلول الاستقصائية. 

۴- انتقل إلى .teradatauniversitynetwork.com‏ حَدَّد نوع المحتوى «المقالات». تصفح قائمة 
«SNL ALI‏ وحَدَّد موقعًا بعنوان: «إدارة أداء الأعمال/ الشركات: تغيير منظر البائع وأهداف 
السوق الجديدة». flo‏ على المقالةء أجب عن الأسئلة التالية: 

-١‏ ما هو التركيز الأساسي للمادة؟ 

-Y‏ ما هي «الوجبات السريعة» الرئيسة من المادة؟ 

*- في المقالة, ما هي الوظيفة أو الدور التنظيمي الأكثر مشاركة بشكلٍ وثيق في SCPM‏ 

£- ما التطبيقات التي تغطيها SCPM‏ 

0- كيف تشبه هذه التطبيقات أو تختلف عن التطبيقات التي تغطيها CPM‏ لشركة SGartner‏ 

1- ما هي $GRC‏ وما هي صلتها بأداء الشركة؟ 

-V‏ ما هي بعض عمليات الاستحواذ الرئيسة التي حدثت في سوق الاجتماع التحضيري للمؤتمر 
خلال العامين الماضيين؟ 

ode -A‏ اثنتين من الشركات التي cog‏ مناقشتها في المقالة (وليس SAP‏ أو Oracle‏ أو (IBM‏ ما هي 
إستراتيجيات CPM‏ لكل من الشركات؟ كيف يفكر المؤلفون فيما يتعلق بهذه الإستراتيجيات؟ 

-١5‏ انتقل إلى rus -teradatauniversitynetwork.com‏ نوع المحتوى «دراسات الحالة». 
تصفح قائمة الحالات» 2455 موقع «لوحات بيانات فورية في stus. «Western Digital‏ على 
هذه المقالةء أجب عن الأسئلة التالية: 

SVIS ما هو‎ -١ 

$BPM عن بنية‎ VIS كيف تتشابه أو تختلف بنية‎ -Y 

-Y‏ ما هي أوجه التشابه والاختلاف بين عمليات الحلقة المغلقة من BPM‏ والعمليات في دورة 
قرار 00104 (رَصْدء توجیه» اتخاذ قرارء الفعل)؟ 
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£- ما هي أنواع لوحات المعلومات الموجودة في النظام؟ هل هي تشغيلية أم تكتيكية؟ أم 
هي في الواقع بطاقات أداء؟ اشرح إجابتك. 

0- ما هي المزايا الأساسية التي يوفرها نظام VIS‏ ولوحات المعلومات في SWestern Digital‏ 

1- ما أنواع الاستشارات التي يمكنك تقدهها إلى شركة تستعدٌ لإنشاء لوحات VIS‏ الخاصة بها؟ 


مهام الفريق» ومشروعات لعب الأدوار: 

-١‏ كانت Kathryn Avery DBA‏ مع سلسلة متاجر التجزئة على مستوى البلاد (سلسلة كبيرة) 
على مدى السنوات الست الماضية. وقد cub‏ منها في الآونة الأخيرة قيادة تطوير أول 
مستودع للبيانات في سلسلة Chain‏ 818. كان المشروع برعاية الإدارة العليا ورئيس قسم 
المعلومات. يتمثل الأساس المنطقي لتطوير مستودع البيانات في النهوض بأنظمة التقارير - لا 
سيما في المبيعات والتسويق وعلى المدى الطويل - لتحسين إدارة علاقات العملاء في السلسلة 
الكبيرة. وقد ذهبت Kathryn‏ إلى مؤتمر معهد مستودعات البيانات وكانت تقوم ببعض 
القراءة؛ لكنها لا تزال مغمورة بشأن منهجيات التطوير. إنها تعلم أن هناك مجموعتين - 
DMs (Kimball); EDW (Inmon)‏ الهيكلي - واللتان تمتلكان مَبْزات قوية بنفس القدر. 
في البداية؛ كانت تعتقد أن المنهجيتين مختلفتان Gle‏ لكن نظرًا لأنها درستهما بعناية ST‏ 
فلم تكن على يقين من ذلك. لدى Sae Kathryn‏ من الأسئلة التي ترغب في الإجابة عنها: 
-١‏ ما هي الفروق الحقيقية بين المنهجيات؟ 

-Y‏ ما هي العوامل المهمة في اختيار منهجية معينة؟ 

-Y‏ ماذا ينبغي أن تكون خطوتها التالية في التفكير في المنهجية؟ 

ساعد Kathryn‏ في الإجابة عن هذه الأسئلة. (تمّ تعديل هذا التمرين من 
.(Duncan, K., Reeves, L., & Griffin, J. 2003, Fall‏ منظور ذكاء الأعمال الخبراء. 
-Business Intelligence Journal, 8(4), 14-19‏ 





Jeet Kumar ix) -Y‏ مدير مستودعات البيانات في بنك إقليمي كبير. تم تعيينه قبل 
۵ سنوات لتنفيذ مستودع بيانات لدعم إستراتيجية عمل CRM‏ الخاصة بالبنك. باستخدام 
مستودع البيانات؛ نجح البنك في gss‏ معلومات العملاء وفهم ربحية العملاء وجذب العملا 
وتعزيز علاقات العملاءء والاحتفاظ بالعملاء. على quai ^s‏ اقترب مستودع بيانات البنك من 
الفورية من خلال الانتقال إلى عمليات التحديث المتكررة لمخزن البيانات. والآن؛ يريد البنك 
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تنفيذ تطبيقات الخدمة الذاتية للعملاء ومراكز الاتصال التى تتطلب بيانات أكثر عذوبةٌ مما هو 
متوفر d bo‏ المستودع. يريد Jeet‏ بعض الدعم في النظر في إمكانيات تقديم بيانات أعذب. 
asi‏ أحد البدائل لذلك هو الالتزام الكامل بتنفيذ RDW‏ لدی مورد ETL‏ استعدادٌ لمساعدته 
على إجراء هذا التغيير. ومع US‏ فقد تمّ إبلاغ Jeet‏ عن تقنيات EAI‏ و۴11 ويتساءل كيف 
هكن أن تتناسب مع خططه. وعلى وجه الخصوص يتساءل Jeet‏ الأسئلة التالية: 

SEI; EAI ما هي بالضبط تقنيات‎ -١ 

SETL و5811 ب‎ EAI كيف يرتبط‎ -Y 

SRDW ب‎ 8119 EAI كيف يرتبط‎ -Y 

-t‏ هل 455 JS‏ من EAI‏ و۴11 ضروريتين ل RDW‏ أم مكملتين el da)‏ بديلتين عنها؟ 
ساعد Jeet‏ في الإجابة عن هذه الأسئلة. (تم تعديل هذا التمرين من 
.Brobst, S., Levy, E., & Muzilla, C. 2005, Spring‏ تكامل تطبيقات المؤسسات 
وتكامل معلومات الشركات. )27-33 ,)2( 10 Journal Intelligence Journal,‏ 

-Y‏ قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في منظمتك؛ لتحديد كيف يمكن أن 
يساعدهم مستودعات البيانات في عملهم. اكتب اقتراحًا يَصف نتائجك. مع تضمين تقديرات 
التكلفة والفوائد في تقريرك. 

-é‏ راجع قائمة مخاطر مستودعات البيانات الموضّحة في هذا الفصل» وابحث عن مثالين لكل منها 
في الواقع العملي. 

0- يمكنك الوصول إلى «teradata.com‏ وقراءة الأوراق البيضاء «قياس عائد استثمار مستودع 
البيانات» و«تحقيق عائد الاستثمار: إسقاط وحصاد قيمة الأعمال لمستودع بيانات اممؤسسة». 
Lal‏ شاهد الدورة المستندة إلى الويب dole»‏ عائد الاستثمار: كيف يتعامل الممارسون 
الرائدون مع المسائل المعقدة لقياس عائد الاستثمار eal Aog «DW‏ القضايا الموضحة 
فيها. قارن هذه القضايا بعوامل النجاح الموصوفة في (20062) -Ariyachandra sWatson‏ 

IK A‏ المقال بقلم .Liddell Avery, K., & Watson, H. J. (2004), Fall‏ تدريب المستخدمين 
النهائيين لمستودعات البيانات. Journal Intelligence Journal, 9 (4), 40-51 (which‏ 
KS „available at teradatauniversitynetwork.com)‏ في الفئات المختلفة للمستخدمين 
النهائيينء قم بِوَضْف الصعوبات التي تواجههم» ومناقشة فوائد التدريب المناسب لكل 
مجموعة. اجعل ÍS‏ عضو من أعضاء المجموعة يتولى أحد الأدوارء وقم بإجراء مناقشة حول 
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كيفية أن يكون نوعًا Cala‏ من التدريب على مستودعات البيانات مفيدًا لكل منكما. 

-V‏ يقدّم كل مورد من موردي BPM/CPM‏ تقريبًا دراسات حالة على مواقع الويب الخاصة به. باعتبارك 
فريق «das‏ حَدَّد اثنين من هؤلاء المورّدين (يمكنك الحصول على أسمائهم من قوائم Gartner‏ أو 
(AMR‏ ثم قم باختيار حالتين من JS‏ موقع من هذه المواقع. ولل حالة قم بإجراء ما يلي: 

-١‏ تلخيص المشكلة التي كان العميل يحاول معالجتها. 
-Y‏ التطبيقات أو الحلول التي تم تنفيذها. 
-Y‏ الفوائد التي يتلقاها drasl‏ من النظام. 

تمارين الإنترنت: 

-١‏ ابحث في الإنترنت للعثور على معلومات حول مستودعات البيانات. حَدَّد بعض مجموعات الأخبار التي 
لها اهتمامٌ بهذا ا مفهوم. استكشف ABI/INFORM‏ في مكتبتك ومكتبتك الإلكترونية Googles‏ 
للاطلاع على اللقالات الحديثة حول الموضوع. ابدأ ب technologyevaluation.com tdwi.org‏ 
واموردين الرئيسيين: .ncr.coms oracle.com sas.com s teradata.com‏ تحقق lá‏ من 
-db2mag.com dssresources.com s dmreview.coms cio.com‏ 

-egain.com fairisaac.com مع‎ lot وبعض الموردين.‎ ETL استطلع رأي بعض أدوات‎ -Y 
.(informationbuilders.com الآن‎ Au (والتي‎ dmreview.com أيضًا استشر‎ 

-Y‏ اتصل ببعض مورّدي مستودع البيانات» واحصل على معلومات حول منتجاتهم. أعط اهتمامًا 
خاضًا للمورّدين الذين jodi‏ أدوات لأغراض badeh‏ مثل: Software A &s «Cognos‏ 
.Oracles SAS Institutes .G‏ يوفر بعض هؤلاء المورّدین عروضًا تجريبيةٌ Adios‏ عبر 
الإنترنت. قم بتنزيل عرض أو اثنين منها وقم بتجربتهما. اكتب تقريرًا عن تجربتك. 

£- تصفح teradata.com‏ للتطورات وقصص النجاح حول مستودعات البيانات. اكتب تقريرًا e‏ اكتشفته. 

0- تصفّح tteradata.com‏ بحنّا عن الأوراق البيضاء والدورات المستندة d]‏ الويب حول 
مستودعات البيانات. قراءة السابق ومشاهدة هذا الأخير. oks)‏ الصف حتى يتم تغطية 
جميع المصادر) اكتب تقريرًا عمًا اكتشفته. 

1- قم بإيجاد حالات حديثة من تطبيقات مستودعات البيانات الناجحة. انتقل إلى مواقع مورّدي 
مستودع البيانات وابحث عن الحالات أو قصص النجاح. اختر واحدة dgio‏ واكتب ملخصًا 
مختصرًا لتقدهه إلى زملائك. 
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التحليلات التنبؤية (V)‏ 
عملية» وطرق» وخوارزميات التنقيب في البيانات 


أهداف التعلم: 
- تعريف التنقيب في البيانات كتقنية تمكينية لتحليلات الأعمال. 
- فهم أهداف وفوائد التنقيب في البيانات. 
- الدراية الكاملة مجموعة واسعة من تطبيقات التنقيب في البيانات. 
- تعلّم عمليات التنقيب في البيانات القياسية. 
elo -‏ أساليب وخوارزميات مختلفة من التنقيب في البيانات. 
- بناء الوعي بأدوات البرامج الحالية للتنقيب في البيانات. 
- فهم قضايا الخصوصية ومشكلات وخرافات التنقيب في البيانات. 

بصفة عامة؛ 3d‏ التنقيب في البيانات Ais Jb‏ لتطوير المعلومات الاستخبارية (أيْ: ا معلومات 
أو المعرفة القابلة للتطبيق) من البيانات التي تُعنى المنظمة بجمعها وتنظيمها وتخزينها. 
وتستخدمٌ المنظمات مجموعةً واسعة من تقنيات التنقيب في البيانات للحصول على فهم أفضل 
لعملائها ولعملياتها ولحل المشكلات التنظيمية المعقدة. وندرس في هذا الفصل عملية التنقيب في 
البيانات كتقنية تمكينية لتحليلات الأعمال والتحليلات التنبؤية» والتعرّف على العمليات القياسية 
لإجراء مشار يع التنقيب في البيانات» وفهم وبناء الخبرات في استخدام تقنيات التنقيب في البيانات 
الرئيسة» وتطوير الوعي بأدوات البرامج الموجودة. واستكشاف قضايا الخصوصية والخرافات 
الشائعة والمشكلات التي ترتبط غالبًا بالتنقيب في البيانات. 


١-4‏ مقال افتتاحي: قسم شرطة ميامي ديد يستخدم التحليلات التنبؤية؛ 
للتنبؤ بالجريمة ومكافحتها: 

أصبحت التحليلات التنبؤية والتنقيب في البيانات Él‏ لا يتجزأ من العديد من وكالات إنفاذ 
القانون, ا في ذلك إدارة شرطة ميامي ديد والتي لا تقتصر مهمتها على حماية أمن أكبر مقاطعة 
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في فلوريدا التي تضم ۲,١‏ مليون مواطن (مما يجعلها سابع أكبر ولاية في الولايات المتحدة)» 
ولكن Lj]‏ لتوفير مناخ aal‏ وجذاب طلايين السياح الذين يأتون من جميع أنحاء العام للاستمتاع 
بالجمال الطبيعي للمقاطعة؛ وكذلك المناخ الدافئ» والشواطن الخلابة. ومع إنفاق السياح ما 
يقرب من ۲۰ مليار دولار أمريي JS‏ عام وضع ما يقرب من ثلث ضرائب المبيعات في فلوريدا؛ 
فمن الصعب المبالغة في أهمية السياحة في اقتصاد المنطقة. وعلى الرغم من أن áb‏ من ضباط 
الشرطة في المقاطعة من e A‏ أن يدرجوا التنمية الاقتصادية في وَضْف وظائفهم؛ فإن كلهم 
تقريبًا يدركون العلاقة الوثيقة بين الشوارع الآمنة والازدهار الذي تحرّكه السياحة في المنطقة. 

lids‏ هذه القضية ذات أهمية قصوى بالنسبة للملازم أرنولد بالمرء الذي يشرف حاليًا على 
قسم التحقيقات في السرقة» والمشرف السابق على تفاصيل التدخل في قضايا السرقة في الإدارة. 
إذ يركز هذا الفريق المتخصّص من المحققين بشكلٍ ÉS‏ على مراقبة النقاط الساخنة للسرقة 
بالمقاطعة وأسوأ المخالفين. ويحتل هو وفريقه مكاتب متواضعة في الطابق الثاني من مبنى 
خرساني حديث المظهرء متفرّع من شارع مُحاط بالنخيل على الطرف الغربي من ميامي. وقد شهد 
بالمر الكثيرَ من التغييرات في السنوات العشر التي قضاها في الوحدة» من le YY Lol‏ في القوة. 
ولا يقتصر الأمرٌ على ممارسات الشرطة. مثل الطريقة التي استخدمها فريقه في تحديد المواقع 
الساخنة لجرائم الشوارع باستخدام دبابيس ملوّنة على خريطة. 


تقليص خدمات الشرطة: 

وشهد بالمر وفريقه AJ‏ تأثير تزايد عدد السكانء وتحؤل التركيبات السكانية, والاقتصاد ا متغير في 
الشوارع المخولون بحراستها. ومثل GÍ‏ قوة شرطة جيدة؛ قاموا بتعديل أساليبهم وممارساتهم باستمرار؛ 
مواجهة تحَذَّي الشرطة الذي اتسع نطاقه وازداد تعقيده. ولكن على غرار جميع فروع حكومة 
المقاطعة تقريبًا؛ فإن ضغوط اللوازنة المتزايدة وضعت الإدارة في حالة ضغط بين الطلبات المتزايدة 
lig‏ ص الموارد. يقول clo‏ الذي يرى المحققين كمقاتلين في خط المواجهة ضد موجة متصاعدة من 
جرائم الشوارع والاحتمالات المرتقبة لموارد متشددة: «كان التحَدّي الأساسي الذي واجهناه؛ هو LAS‏ 
is‏ من جرائم الشوارع حتى في الوقت الذي تسببت فيه الموارد المحدودة في تقليص عدد رجال 
الشرطة في الشارع». كان الفريق على js‏ السنين pa‏ له بتجربة أدوات جديدة كان أبرزها برنامجاً 
أطلق عليه «الإنفاذ القائم على التحليلات»» والذي استخدم بيانات تاريخ الجرهة كأساس لتعيين فرق 
التحقيق. ويضيف بالمر: «لقد تطوّرنا 25 منذ ذلك الحين في قدرتنا على التنبؤ بالمكان الذي هكن أن 
يحدث فيه سرقة؛ وذلك من خلال JS‏ من استخدام التحليل وتجربتنا الجماعية الخاصة». 
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التفكير الجديد في الحالات الباردة: 


يتمثل التحَدَّي الأكثر إرباكًا لبالمر وفريقه من المحققين في إغلاق الحالات الأصعبء وهو X53‏ 
مشترك مع الشرطة في جميع المناطق الحضرية الرئيسة؛ إذ يفتقرٌ إلى الأدلة أو الشهود أو الفيديو 
al)‏ الحقائق أو الأدلة التي يكن أن تساعد في je‏ قضية ما). يقول بالمر: alo‏ ليس مفاجنًا؛ 
oy‏ الممارسات القياسية التي استخدمناها في توليد العملاء ابمحتملين» مثل: eral‏ إلى المخبرين 
أو ا مجتمع أو ضباط الدوريات؛ لم تتغيّر i‏ على كل dio‏ يعمل هذا النهج بشكلٍ جيد؛ لكن 
أحد عيوبه أنه يعتمد كثيرًا على خبرات محققينا. فإذا تقاعد هؤلاء المحققون أو انتقلوا إلى أعمالٍ 
أخرى؛ فإن هذه الخبرات تذهب معهم». 

كان pbl $a‏ هو أن معدل الدوران - بسبب تقاعد العديد من المحققين الأكثر ge‏ لديه - 
كان في اتجاه تصاعدي. وتوصّل إلى do ói‏ هذا اللغز SAS‏ في Gub‏ دماء جديدة من محققين 
أصغر سند فهم أيضًا يجيدون التعامل مع أنواع المعلومات الجديدة - كرسائل البريد الإلكتروني» 
ووسائل الإعلام الاجتماعيةء وكاميرات ال مرورء على سبيل المثال لا الحصر - وذلك ace‏ أيضًا من 
الوصول السريع إليها. ولكن كما يقول با مر: «جاءت المشكلة عندما تحؤّلت مجموعةٌ من 
المحققين الجُدُد الذين جاءوا إلى الوحدة للبحث عن توجيهات من JLS‏ الضباط. في هذه المرحلة 
فقط تأكدنا أننا بحاجة إلى طريقة مختلفة لملء فجوة الخبرة في المستقبل». 

وقد oS]‏ جه ودُ بار المنصبّة على التفكير في d‏ لهذا اللغز؛ إلى التوصّل إلى ما يُسمّى تكهُنات 
السماء الزرقاء. فماذا لو أن المحققين الجدد في الفرقة يمكن أن يطرحوا نفس الأسئلة على قاعدة بيانات 
الحاسبء كما لو كانوا مخبرًا مخضرمًا؟ زرعت هذه المضاربة في عقل بال مر عددًا لا نهائيًا من الأفكار. 


الصورة الكبيرة تبدأ صغيرة: 

أظهر ما كان يتبلور داخل وحدة كشف جرائم السرقةء كيف هكن للأفكار الكبيرة أن db‏ من 
أماكن صغيرة. ولكن الأهم من ذلك؛ هو أنه a‏ أنه لكي تصل هذه الأفكار إلى مرحلة الثبات؛ 
يجب أن تكون الشروط «الصحيحة» متوافقة في الوقت المناسب. فعلى مستوى القيادة؛ فإن 
ذلك يعني أن الشخصية القيادية في المنظمة هي التي تعرف ما يتطلبه الأمر من أجل تغذية 
الدعم من أعلى إلى أسفل؛ فضلًا عن استقاء المعلومات الذكائية كذلك من أسفل إلى أعلى داخل 
الهيكل التنظيمي. كان هذا الشخص هو بالمر نفسه. على المستوى التنظيمي؛ شكّلت وحدة 
جرائم السرقة نقطة انطلاق جيدة بشكلٍ خاص لنمذجة المبادرة؛ بسبب قيام بعض الجُناة بتكرار 
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جرائمهم. وف النهاية؛ فإن قدرة الإدارة على إطلاق العنان للقدرة التحويلية الأوسع نطاقًا لنمذجة 
اطبادرة ستعتمدٌ إلى à‏ كبير على قدرة الفريق على تحقيق قيق النتائج على نطاق أصغر. 

عندما أثبتت الاختباراتٌ المبكرة والعروض التوضيحية lp‏ مشجعةً - رغم أن النموذج م ha‏ 
نتائج FERN‏ إلا عندما تم تغذيته بتفاصيل الحالات التي تم lle‏ - بدا أ الفريق في جذب الانتباه. 
وقد تلفت أطبادرة دفعة ENG‏ عندما عبر مسؤولو وحدة شرطة السرقة عن دعمهم لاتجاه 
امشروع» وقالوا لبا مر: «إذا استطعت القيام بهذا العملء فافعل». ولكن الأهم من التشجيع - 
كما ési‏ باي مر - هو استعدادهم للدفاع عن المشروع بين الأقسام الأعلى في الإدارة. يقول با مر: 
b»‏ أكن لأترك المشروع على الأرض إذا مم يباركه كبار الضباط؛ لذلك كان دعمهم حاسمّا». 


النجاحٌ يجلبٌ المصداقية: 


بعد تعيين المسؤول (sl‏ للاتصال بين تقنية ا معلومات ووحدة مكافحة السرقة؛ شرّع بالمر 
في تعزيز أداة نمذجة المبادرة - والتي 35( عليها الآن رسميًا Blue PALMS‏ من أجل برامج 
النمذجة الرائدة في التحليلات التنبؤية - من خلال تحقيق العديد من النجاحات المتوالية. م 
يكن أنصاره من LS‏ الضباط فحسب؛ بل Lá‏ هؤلاء المحققون الذين سيكون دعمهم alo‏ في 
تبنّيه بنجاح كأداة لمكافحة السرقة. وقد قُوبل با مر عند محاولته تقديم Blue PALMS‏ بمقاومة 
عنيفة من قبل المحققين القدامى» الذين لم يكن لديهم أي مبرر iU‏ عن ممارساتهم القدهة. 
وهنا أدرك بالمر أنَّ الإملاء أو الإكراه لن يجعله ينال وُدّهم وبالتالي ولا دعمهم. ولذا سيحتاج إلى 
بناء جسر من المصداقية. 

وجد با مر تلك الفرصة في واحدٍ من أفضل المحققين لديه وأكثرهم خبرةً. في Cs‏ مبكرٍ من 
التحقيق في السرقة؛ أشار المحقق إلى بالمر أنه كان لديه حدس قوي بمرتكب الجرهة المطلوب 
ضبطه بالأساس, لاختبار نظام -Blue PALMS‏ وبناءً على طلب المحقق؛ قام محلل القسم بتغذية 
النظام بالتفاصيل الرئيسة للجرهةء ا في ذلك طريقة التشغيل. وقامت النماذجٌ الإحصائية 
للنظام بامقارنة بين هذه التفاصيل وقاعدة البيانات التاريخية للبيانات؛ وذلك Éa‏ عن ارتباطات 
وأوجه تشابه مهمة في تحديد هوية المجرم. وقد تضمّن التقرير الذي صدر عن العملية AB‏ 
تضم ۲۰ مشتبهًا تم ترتيبهم حسب ترتيب قوة الجرهة أو احتمال حدوثها. وعندما قام ا محلل 
بتسليم التقرير للمحقق؛ كان المشتبه فيه ضمن المراكز الخمسة الأولى. وبعد فترة وجيزة من 
اعتقاله؛ اعترف» واكتسب بام مر أرضًا áo‏ لمشروعه. 
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على الرغم من أنه كان É ë‏ مفيدًا؛ فقد أدرك بالمر أن الاختبار الحقيقي لم يكن في تأكيد الحدس؛ 
ولكن في كسر الحالات التي وصلت إلى طريق مسدود. وعلى iA‏ تعبير بالمر: «كان هذا هو الوضع 
في سرقة السيارات؛ إذ V‏ شهود ولا فيديو ولا مسرح جرهة». عندما قام المخبرٌ الأقدم في القضية 
المتوقفة بإجازة بعد ثلاثة أشهر؛ طلب المخبرٌ الصغير الذي 3& تعيينه له تقرير -Blue PALMS‏ وتم 
عرض صورٍ لأشخاص ذوي حيثية في قائمة المشتبه فيهم, وقام الضحايا بتحديد هوية المشتبه فيه 
بشكل دقيق؛ مما أدى إلى ختام ناجح للقضية. وكان هذا المشتبه فيه رقم واحد في القائمة. 


الحقائق فقط: 

لقد gafë‏ النجاحٌ المتواصل ل Blue PALMS‏ عن نجاح با مر في استقطاب المحققين إلى alo‏ 
ولكن إذا كان هناك جزءٌ من رسالته (AD‏ مزيدًا من الصدى لدى المحققين التابعين له؛ فإن الحقيقة 
هي أنه قد تمّ مراعاة عدم تغيير أساسيات ممارسات الشرطة عند تصميم Blue PALMS‏ بل أكثر 
من ذلك فقد تمّ تحسينها من خلال مَنْحهم فرصةً ثانيةً لتفنيد مزاعمهم تلك بعدم قدرتهم على 
مجابهة التطورات الحديثة. يقول با مر: «إنَّ عمل الشرطة هو جوهرٌ العلاقات الإنسانية - من 
حيث التحدّث مع الشهود. مع الضحاياء مع المجتمع - ونحن لسنا على استعداد لتغيير ذلك؛ بل إن 
هدفنا هو gis‏ الباحثين إحصاءات واقعية من المعلومات التي لدينا بالفعل والتي قد تُحدث فرقًا؛ 
لذا حتى لو نجحنا بنسبة X0‏ من الوقت؛ فسوف نأخذ الكثير من المذنبين من الشارع». 

لقد ساعدت القائمة المتزايدة للحالات الباردة التي lao‏ با مر في جهوده لتعزيز مزايا Blue‏ 
-PALMS‏ ولكن في إظهار أين يكمُّنُ ولاؤه؛ فهو يرى أن المحققين الذين أغلقوا هذه الحالات 
الباردة - وليس البرنامج - أنهم يستحقون مزيدًا من تسليط الضوء عليهم وقد أت ذلك eI‏ 
بشماره كما خطط له با مر. las‏ على طلب رئيسه» بدأ بالمر في إجراء اتصالاته كمنصة للوصول 
إلى مناطق أخرى في إدارة شرطة ميامي ديد. 


شوارع أكثر Gal‏ تعني yao‏ أكثر أناقةٌ: 

عندما يتحدث عن تأثير السياحةء وهي مؤشرٌ ترابط تد من خلال رؤية مدن ميامي ديد 
الأكثر 55 ينظر بامر إلى Blue PALMS‏ على أنها أداةٌ مهمة لحماية أحد أعظم أصول المقاطعة. 
يقول با مر: «كان التهديد للسياحة بسبب تزايد الجرائم في الشوارع Gu‏ رئيس ا في تأسيس 
الوحدة». ويضيف: «إن حقيقة قدرتنا على استخدام التحليلات والذكاء لمساعدتنا في إغلاق 
ا مزيد من القضايا وإخلاء الشوارع من المجرمين» هو خبرٌ سار مواطنينا ولصناعة السياحة لدينا». 
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ماذا يُمكننا أن نتعلّم من هذه المقالة القصيرة؟ 

تتعرّض هيئات وإدارات تطبيق القانون لضغوط هائلة لتنفيذ مهمتها المتمثلة في حماية الأشخاص 
ذوي الموارد المحدودة. ÓI‏ البيئة التي يؤدون فيها واجباتهم تصبح أكثر تحديًا على نحو متزايد؛ 
بحيث يتعيّن عليهم أن يتخذوا باستمرار موقعًا في قلب الحدث ورها يبقون على بُعْد خطوات قليلة 
ع احتمال وقوع كوارث. ويمثل فهم الطبيعة المتغيرة للجرهة والمجرمين Dao‏ مستمرًا. ففي 
gàs‏ هذه التحَدَّيات؛ يعمل توفر البيانات وتقنيات التحليلات؛ من أجل تحليل الأحداث الماضية 
بشكل أفضل والتنبؤ بالأحداث المستقبليةء Cass‏ ذلك كله في صالح هذه الوكالات. 

وقد أصبحت البيانات doa‏ أكثر مما كانت عليه في الماضي. وبالتالي؛ فإن تطبيق أدوات 
التحليل المتطوّرة وأدوات التنقيب في البيانات ssl)‏ تقنيات اكتشاف المعرفة) على هذه المصادر 
الضخمة والغنية بالبيانات يوفر لهم الرؤية التي يحتاجون إليها لتحضير وتنفيذ واجباتهم بشكلٍ 
أفضل. وبذلك تكون وكالات تطبيق القانون من al‏ المستخدمين للوجه الجديد للتحليلات؛ 
إذ d‏ التنقيب في البيانات مرشهًا أساسيًا لفهم أفضل وإدارة أقوى للمهامٌ الحسّاسة فضلا عن 
مستوى Jle‏ من الدقة والتوقيت المناسب. وتوضّح الدراسة المعروضة في القالة القصيرة الافتتاحية 
بوضوح قوة التحليلات والتنقيب في البيانات لتوفير رؤية شاملة bla‏ الجرهة وا مجرمين؛ من أجل 
تفاعل وإدارة أفضل وأسرع. وسنعرض في هذا الفصل مجموعةٌ s ls‏ من تطبيقات التنقيب 
في البيانات التي تقدّم حلولًا للمشكلات المعقدة في مجموعة متنوعة من الصناعات والإعدادات 
التنظيمية؛ إذ يتم استخدام البيانات للحصول على رؤية قابلة للتطبيق بغرض تحسين جاهزية 
المهمة ورفع الكفاءة التشغيلية وتحقيق الميزة التنافسية. 
أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ اذا تتبَنّى وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامى ديد التحليلات المتقدمة 

والتنقيب في البيانات؟ ١‏ 
-Y‏ ما هي eal‏ التحَدّيات التي تواجه وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامي 


ديد؟ هل يمكنك التفكير في تحَدَّيات أخرى (غير مذكورة في هذه الحالة) يمكنها الاستفادة 
من التنقيب في البيانات؟ 


-Y‏ ما هي Jolas‏ البيانات التي تس تخدمها وكالات تطبيق القانون والإدارات» مثل إدارة شرطة 
ميامي ديد لمشاريعها المتعلقة (sa‏ من النمذجة التنبؤية والتنقيب في البيانات؟ 


un‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


-E‏ ما نوع التحليلات التي تستخدمها وكالات تطبيق القانون والإدارات» Jia‏ إدارة شرطة ميامي 
ديد لمحاربة الجريمة؟ 
0- ماذا تعني «الصورة الكبيرة تبدأ صغيرة» في هذه الحالة؟ اشرح. 


ع-؟ مفاهيم وتطبيقات التنقيب في البيانات: 

لقد أصبحت عملية التنقيب في البيانات - وهي تقنية جديدةٌ ومثيرة لم تظهر إلا منذ بضع 
سنوات فقط - عمليةً شائعةً تمارسها RS T‏ المنظمات. ds‏ مقابلة أحرتها مجلة Computerworld‏ 
مع الدکتور Arno Penzias‏ (الحائز على جائزة نوبل leg‏ سابق في مختبرات (Bell‏ في يناير 
5م قام الدكتور Arno‏ بتحديد البيانات المُستخرّجة من القواعد التنظيمية باعتبارها تطبيقًا 
Las‏ للشركات في المستقبل القريب. ورذا على سؤال قديم طرحته جريدة Computerworld‏ 
حول «ما هي التطبيقات القاتلة في الشركة؟» أجاب الدكتور Penzias‏ بقوله: «التنقيبٌ في 
البيانات». وأردف ÉB‏ «سوف تصبح عملية التنقيب في البيانات أكثر أهميةًء ولن تضطر 
الشركات للتخلص من أي شيءٍ يتعلق بعملائهم؛ لأن ذلك سيكون ذا قيمة كبيرة. وإذا لم تفعل 
ذلك فأنت خارج العمل». وبالمثل فقد ناقش )2006( Thomas Davenport‏ في مقال نشر في 
ob Harvard Business Review‏ أحدث سلاح إستراتيجي للشركات هو اتخاذ القرار التحليليء 
وقدّم أمثلةٌ لشركات مثل: «Marriott International s «Capital Ones «Amazon.com‏ وغيرها 
من الشركات التي استخدمت التحليلات؛ لفهم عملائها بشكلٍ أفضل وتحسين سلاسل التوريد 
الموسّعة لزيادة عوائدهم على الاستثمار إلى أقصى A5‏ مع توفير أفضل خدمة للعملاء. حيث 
يعتمدُ هذا المستوى من النجاح بشكل كبير على فهم الشركة لعملائهاء وللموردين» وللعمليات 
التجارية؛ إضافةٌ إلى فهمها لسلسلة التوريد الممتدة بشكل جيد. 

ومن الممكن أن b‏ جزءٌ كبيرٌ من «فهم العميل» من خلال تحليل كمية البيانات الهائلة 
التي تجمعها الشركة. والجديرٌ SU‏ أن تكلفة تخزين ومعالجة البيانات قد انخفضت بشكلٍ 
کبیر في الماضي القريب. ونتيجةً لذلك؛ فقد ممت كمية البيانات asl‏ في J‏ إلكتروني معدل 


Sources: Miami-Dade Police Department: Predictive modeling pinpoints likely suspects based on 
common crime signatures of previous crimes, IBM Customer Case Studies, www-03.ibm.com/software/ 
businesscasestudies/om/en/corp?synkey-C894638H25952N07; Law Enforcement Analytics: Intelligence- 


Led and Predictive Policing by Information Builder www.informationbuilders.com/solutions/gov-lea 
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هائل. ومع إنشاء قواعد بيانات كبيرة؛ فقد ظهرت إمكانية تحليل البيانات المخزّنة فيها. وقد 
كان مصطلح التنقيب في البيانات يُستخدّم في الأصل لوَصْف العملية التي يتم من خلالها اكتشاف 
bL al‏ غير معروفة مسبقًا في البيانات. ومنذ ذلك الحين؛ فقد Anal‏ تجاوز هذا التعريف تلك 
الحدود من قبل بعض مُورّدي البرامج ليشمل معظم أشكال تحليل البيانات؛ من أجل زيادة 
المبيعات بشعبية تسمية التنقيب في البيانات. وفي هذا الفصل؛ فإننا نوافق على أن نقبل التعريف 
الأصلي للتنقيب في البيانات. 

وعلى الرغم من أن مصطلح التنقيب في البيانات هو مصطلحٌ جديدٌ Óp s. ao‏ الأفكار التي 
وراءه ليست جديدة؛ إذ تعود جذور العديد من التقنيات المستخدّمة في التنقيب في البيانات إلى 
التحليل Glany!‏ التقليدي والذكاء الاصطناعي منذ أوائل الثمانينيات. فلماذا IS]‏ استحوذت على 
اهتمام عام الأعمال؟ فيما يلي بعض الأسباب الأكثر وضوحًا: 
- زيادة Bio‏ المنافسة على النطاق العالمي تقودها الاحتياجات المتغيرة باستمرار للعملاء وما 

يريدونه في سوق مُسْبَع بشکل متزايد. 

- الاعتراف العام بالقيمة غير المستغلة المخفية في مصادر البيانات الكبيرة. 
- توحيد وتكامل سجلات قاعدة البيانات؛ مما يتيح رؤيةٌ واحدةً للعملاء والمورّدِينء والمعاملات» وما إلى ذلك. 
- توحيد قواعد البيانات ومستودعات البيانات الأخرى في مكانِ واحدٍ في شكل مستودع البيانات. 
- الزيادة المتسارعة في تقنيات معالجة ومستودعات البيانات. 
- انخفاض كبير في تكلفة الأجهزة والبرمجيات لمستودعات البيانات ومعالجتها. 
- التحرّك نحو عملية الإزالة (تحويل موارد المعلومات إلى شكل غير مادى) من الممارسات التجارية. 

وجديرٌ بالذكر OE‏ البيانات التي يُولّدها الإنترنت duly‏ بسرعة؛ من حيث الحجم والتعقيد. 
وقد تمّ Lis)‏ كميات كبيرة من البيانات الجينومية» والتي تراكمت في جميع أنحاء العام. وهناك 
العديدٌ من التخصمّصات التي تنتج كمياتٍ As‏ من البيانات على ساس منتظم. ولذلك يقوم 
الباحثون في المجال الطبي وا مستحضرات الصيدلانية بإنتاج مستودعات البيانات التي هكن 
استخدامها بعد ذلك في تطبيقات التنقيب في البيانات؛ لتحديد أفضل الطرق لتشخيص ومعالجة 
الأمراض بشكلٍ دقيق» واكتشاف عقاقير جديدة Aids‏ 

وعلى الجانب التجاري؛ فإن أكثر القطاعات التي تس تخدم تقنية التنقيب في OBLI‏ 
تتمثل في قطاعات التمويل» والبيع بالتجزئة» والرعاية الصحية؛ }3 edo‏ تقنية التنقيب في 
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البيانات؛ للكشف عن الأنشطة الاحتيالية والحَدَّ dgio‏ لاسيما في مطالبات التأمين واستخدام 
بطاقات الائتمان Chan)‏ وآخرونء 353(« من أجل تحديد cl à bU gi‏ العملاء Hoffman,)‏ 
9 ) واسترداد العملاء المربحين )1998 Léig (Hoffman,‏ لتحديد قواعد التداول من البيانات 
التاريخيةء والممساعدة في زيادة الربحية باستخدام تحليل سلة السوق. ويُستخدم التنقيب في 
البيانات بالفعل على نطاق واسع؛ لتحسين التعامل مع العملاء ومع تطور التجارة الإلكترونية على 
نطاق واسع؛ فإن هذا الأمر لا يمكن أن يصبح أكثر إلحاحًا مع الوقت. انظر الحالة العملية A-E‏ 
للحصول على معلومات حول كيفية استخدام شركة Infinity P&C‏ للتحليلات التنبؤية والتنقيب 
في البيانات؛ لتحسين خدمة العملاء ومواجهة الاحتيال وزيادة الرّبح. 


حالة عملية ١-6‏ 
٩‏ هي ji‏ لتجربة العملاء مع Ll‏ من الاحتيال؛ بالتنقيب في البيانات والتحليلات التنبؤية 

عندما بدأت الشركات المصدرة للبطاقات لأول مرة باستخدام برامج قواعد العمل 
الآلي؛ لمواجهة الاحتيال في البطاقات المصرفية وبطاقات الائتمان - كانت القيوذ المفروضة 
على هذه التقنية واضحةٌ GL‏ اشتكى العملاءٌ من عدم قدرتهم على الدفع لرحلات 
عطلاتهم أو رحلات العمل المهمة. وتعمل Visa‏ على تحسين تجربة عملائها؛ من 
خلال توفير أدوات لتقليل مخاطر الاحتيال؛ إضافةٌ إلى توفير الخدمات الاستشارية التي 
جعلت إستراتيجياتها أكثر Alad‏ وتهدف Visa‏ من خلال هذا gall‏ إلى تحسين تجربة 
العملاءء إضافة إلى تقليل المعاملات غير الصالحة. 

وجديرٌ بالذكر SI‏ الشبكة العالمية للشركة تربط آلاف المؤسسات اطالية بملايين 
التجار وحاملي البطاقات S‏ يوم. وقد كانت usl Visa‏ في مجال المدفوعات 
غير النقدية لأكثر من 20 Gle‏ كما كانت تدعمٌ المؤسسات المالية باستخدام تحليلات 
5 وذلك 45 من الاحتيال دون glej!‏ العملاء برفض الدفع دون مبرر. وعندما 
تقوم Visa‏ بمعالجة إحدى المعاملات؛ فإنها تقوم بتحليل ما يصل إلى 0٠١‏ متغير فريد 
بشكل فوري لتقيم مخاطر تلك المعاملة. وتستطيع الشركة باستخدام مجموعات هائلة 
من obk‏ بمافي ذلك النقاط الجديدة الاحتيالية العالمية وأنماط المعاملات - أن 
تُحدّد بدقة ما إذا كنت تشتري في باريس. أو أن شخصاً آخر سرق بطاقة الائتمان 
الخاصة بك. وقد ذكر Nathan Falkenborg‏ رئيس حلول الأداء في Visa‏ بشمال آسيا 
أن: «ما يعنيه ذلك هو أنه إذا كنت ستسافر على الأرجح؛ فنحن نعرف ذلك ونخبر 
مؤسستك AU‏ حتى لا يتم رفضك في نقطة البيع». وأضاف: «كما Lİ‏ سوف نساعدٌ 
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البنك الذي تتعامل معه في تطوير الإستراتيجيات الصحيحة لاستخدام أدوات التأشير 
وأنظمة تسجيل الدرجات». وتستطيع Visa‏ أن تقوم بعمل تحليلات البيانات الكبيرة؛ 
ومن المحتمل ان تستطيع النماذج الحديثة وأنظمة تسجيل الدرجات is‏ ماقيمته 
Y‏ مليار دولار سنوياً من حجم المدفوعات المزوّرة. 

Gul Visa Axis‏ معترفًا به hle‏ وتسهّل Visa‏ تحويل الأموال إلكترونيًا من خلال 
المنتجات ذات العلامة التجارية التي يُصدرها الآلاف من شركاء ا مؤسسات اطالية. وقد 
قامت الشركة بمعالجة 56,5 مليار صفقة في عام eY- M‏ وت عمليات شراء بقيمة £V‏ 
تريليون دولار مع بطاقة فيزا في نفس العام. 

كما Visa S‏ لديها القدرة على معالجة + OT-‏ رسالة معاملة في الثانية الواحدة, 
وهذا الرّقم أكبر من أربعة أضعاف معدل الذروة الفعلي للصفقة حتى الآن. ولا تقوم 
Visa‏ با معالجة والحساب فقط؛ بل هي تستخدم باستمرار التحليلات لتبادل الرؤى 
الإستراتيجية والتشغيلية مع مؤسساتها المالية الشريكة ومساعدتها في تحسين الأداء. 
eR eus‏ هدف هذا العمل من خلال نظام إدارة بيانات قوي. وإضافةً إلى ما سبق؛ فإن 
فيزا تساعدٌ عملاءها على تحسين الأداء من خلال تطوير وتقديم رؤية تحليلية عميقة. 

يقول Ui» :Falkenborg‏ نفهم أنماط السلوك من خلال إجراء التجميع والتجزئة 
على مستوى دقيق, ونحن eb‏ هذه الرؤية لشركائنا في المؤسسات AIUI‏ إنها طريقةٌ 
Izè‏ لمساعدة عملائنا على التواصل بشكل أفضل وتعميق فهمهم للعميل». 

وكمثال على الدّعم التسويقي؛ فقد ساعدت Visa‏ العملاء على الصعيد العالمي في 
تحديد شرائح العملاء التي يجب أن eA‏ لها Visa gie‏ مختلف. يقول :Falkenborg‏ 
d sd»‏ فهم دورة حياة العملاء f]‏ مهما للغايةء وتوفر في زا معلومات للعملاء الذين 
يساعدونهم في اتخاذ الإجراءات وتقديم المنتج المناسب للعميل المناسب قبل أن يصبح 
عرض القيمة متقادمًا». 

كيف هكن لاستخدام التحليلات التي في الذاكرة أن تُحدث 36,3 

تستخدم Visa‏ مؤخرًا حلاً عالي الآداء من dais SAS‏ على الحوس بة في الذاكرة 
لتشغيل الخوارزمية الإحصائية. gius‏ الآلةء ثم تقديم المعلومات بشكلٍ مرفي؛ إذ Jis‏ 
التحليلاث في الذاكرة من الحاجة إلى نقل البيانات وتنفيذ المزيد من عمليات تكرار 
النموذج؛ مما يجعلها أسرع وأكثر »48 
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ويتصف E odi Falkenborg‏ على أنه مثل حفظ المعلومات. بدلا من الاضطرار 
للذهاب إلى خزانة الملفات لاستردادها. فيقول: «التحليلات في الذاكرة تأخذ فقط 
عقلك وتجعله أكبر. كل شيءٍ يمكن الوصول إليه على الفور». 

ds‏ نهاية المطاف؛ فإن التحليلات القوية تساعد الشركة على القيام بأكثر من مجرد 
عملية المدفوعات. يقول LS» :Falkenborg‏ تعميق محادثة العميل وخدمة عملائنا 
بشكل أفضل؛ من خلال مجموعة البيانات الضخمة والخبرات الكبيرة في مجال استخراج 
بيانات المعاملات» نحن تُستخدم قدراتنا في الاستشارات والتحليلات لمساعدة عملائنا في 
مواجهة تحَدّيات الأعمال وحماية نظام الدفع. وهذا ما نفعله بتحليلات عالية الأداء». 

وأضاف Falkenborg‏ موضكًا: gial Ój‏ الذي نواجهه لا يختلف عن i$‏ 
A63‏ يواجه G]‏ شركة تديرٌ وتستخدم مجموعة البيانات الضخمة؛ فهو يتمثل في كيفية 
استخدامنا لجميع المعلومات اللازمة لوَمْع SLÁN Jó‏ التي تواجه الأعمال - سواء 
كان ذلك من شأنه تحسين نماذج الاحتيال لديناء أو مساعدة العميل على التواصل بشكلٍ 
أكثر Jles‏ مع زبائنه». ثم استطرد قائلًا: «تمكّننا التحليلات في الذاكرة من أن نكون 
أكثر فطنة؛ مع سرعة معالجة ٠٠١‏ نظام تحليلي؛ حيث o S‏ لبياناتنا ولعلماء القرار 
لدينا التكرار بشكلٍ أسرع». 

وتسمحٌ التحليلات التنبؤية السريعة والدقيقة لشركة Visa‏ بتقديم خدمة أفضل 
للعملاء؛ إضافةً إلى خدمات استشارية مُتخصّصة؛ مما يساعدهم على النجاح في صناعة 
المدفوعات المتغيرة سريعًا بشكل يومي. 

أسئلة للمناقشة: 





-١‏ ما هي التحَدّيات التي واجهتها Visa‏ وباقي elio‏ بطاقات الائتمان؟ 
-Y‏ كيف Visa isi‏ من تحسين خدمة العملاء مع الاحتفاظ بتحسين الاحتيال؟ 
-Y‏ ما هي التحليلات في SSI‏ ولماذا as‏ ضرورية؟ 


Source: "Enhancing the customer experience while reducing fraud (SAS* Analytics) 
- High-performance analytics empowers Visa to enhance customer experience while 
reducing debit and credit card fraud." Copyright © 2016 SAS Institute Inc., Cary, 
NC, USA. Reprinted with permission. All rights reserved. 
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التعريفات» والخصائصء والفوائد: 

ol‏ مصطلح التنقيب في البيانات ببساطة؛ هو مصطلحٌ Caos] eacus‏ اكتشاف أو «استخراج» 
المعرفة من كميات كبيرة من البيانات. وبالقياس؛ فإنه عند النظرء يستطيع المرء أن يدرك بسهولة 
o‏ مصطلح التنقيب في البيانات ليس صحيحًا؛ إذ إنه gih;‏ على استخراج الذهب من الصخور أو 
التراب» ويُشار إليه باسم استخراج «الذهب» بدلا من الاستخراج «الصخري» أو «الترابي». ولذلك؛ 
فقد كان الأصحٌ أن JUS‏ «استخراج المعرفة» أو «اكتشاف اممعرفة» بدلا من التنقيب في البيانات. 
وعلى الرغم من عدم التوافق بين المصطلح ومعناه؛ فقد أصبح التنقيبٌ في البيانات هو اختيار 
الأغلبية. فالعديدٌ من الأسماء الأخرى المرتبطة بالتنقيب في البيانات تشمل: استخراج المعرفة, 
وتحليل النمط ele‏ الآثار. وحصاد المعلومات» والبحث عن الأماطء وتجريف البيانات. 

ومن الناحية الفنية؛ فإن عملية التنقيب في البيانات هي عمليةٌ تس تخدم تقنيات إحصائية, 
ورياضية» وأساليب الذكاء الاصطناعي لاستخلاص وتحديد المعلومات المفيدة والمعرفة SUMI sl)‏ 
الفرعية من مجموعات كبيرة من البيانات» ومن الممكن أن تكون هذه الأنماط في شكل قواعد العمل 
أو الانتماءات أو الارتباطات أو الاتجاهات أو gòl‏ التنبؤ (انظر: 2001 -(Nemati and Barko,‏ 
ومعظم الأدبيات تُعرّف التنقيبّ في البيانات بأنه: «عمليةٌ غير بديهية لتحديد أنماط صالحة 
وجديدة ومفيدة ومفهومة في نهاية المطاف في البيانات المخرّتة في قواعد البيانات المنظمة»؛ ]5 
يتم تنظيمٌ البيانات في سجلات منظمة من قبل المتغيرات الفئوية والترتيبية والمستمرة Fayyad)‏ 
وآخرون» 1997 ص (EN-E‏ وفي هذا التعريف؛ نجد أن معاني المصطلح الأساسي كما يلي: 
- تشي العملية إلى أن التنقيب في البيانات يضم العديد من الخطوات المتكررة. 
- غير بديهي؛ بمعنى أن هناك بعض عمليات البحث أو الاستنتاج من نوع التجارب؛ بمعنى أنه 

TAPER‏ مثل حساب الكميات المحدّدة مسبقًا. 
- صالح؛ بمعنى أن الأنماط المكتشفة يجب أن تنطبق على البيانات الجديدة بدرجة كافية من اليقين. 
- غير مألوفة؛ بمعنى OT‏ الاماط م تكن معروفةٌ من قبل للمُستخدم في سياق النظام الجاري تحليله. 
- الفائدة المحتمّلة؛ وتعني أنَّ الأماط المكتشّفة يجب أن تؤدي إلى فائدة بعيدة للمستخدم أو اللهمة. 
fs ls -‏ مفهوما؛ معنى أنّ النمط يجب أن يكون منطقيًا من الناحية التجارية إلى الدرجة التي 
تجعل المُستخدم يقول: «امممم يبدو الأمر معقولًا؛ لماذا لم أفكر في ذلك. وإن م يكن هذا على 
الفور, فعلى الأقل بعد تحليل بعض نتائج العمل». 
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Ól‏ التنقيبَ في البيانات ليس نظامًا جديدًا؛ بل هو تعريفٌ جديدٌ لاستخدام العديد من 
التخصّصات؛ إذ يتم es‏ بيانات الاستخراج بشكل مُحكّم عند تلاقي العديد من التخصصات» 
والتي تشمل الإحصاء والذكاء الاصطناعي وتعلم UYI‏ وعلوم الإدارة ونظم المعلومات (IS)‏ وقواعد 
البيانات (انظر الشكل ١-٤‏ إذ ÓI‏ عملية التنقيب في البيانات تسعى Saale‏ إلى التحسين في 
استخراج المعلومات وا معارف المفيدة من قواعد البيانات الكبيرة عن طريق استخدام edil‏ في 
جميع التخصّصات السابقة. وعلى الرغم من أن هذا ا مجال لا يزال في بداياته؛ فإنه جذب إليه 
الكثيرٌ من الاهتمام في وق قصير للغاية. 





علم الإدارة 
ونظم المعلومات 














شكل N-E‏ التنقيب في البيانات هو ga jo‏ من التخصصات المتعددة 
وفيما يلي الخصائصٌ والأهداف الرئيسية للتنقيب في البيانات: 
GG -‏ ما يتم دفن البيانات في أعماق قواعد البيانات الكبيرة der‏ والتي تحتوي lol‏ على بيانات 
من Bl‏ سنوات. وف العديد من الحالات؛ فإن تنظيف البيانات وتوحيدها يتح في مستودع 
البيانات؛ إذ يكن e‏ البيانات بتنسيقات متنوعة (انظر: الفصل Y‏ لتصنيف موجز للبيانات). 
- بيئة التنقيب في البيانات؛ هي Sole‏ بنية العميل/ الخادم أو بنية IS‏ على الويب. 
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- تساعد الأدوات الجديدة المتطوّرة. والتى تشمل أدوات التصوير dadih‏ على إزالة مصادر 
المعلومات المدفونة في ملفات الشركة أو السّجلات العامة الأرشيفية. والبحث عن ذلك يشمل 
تدفق ومزامنة البيانات؛ للحصول على النتائج الصحيحة. كما يستكش ف العمال المتقنون 
للتنقيب ف البيانات أيضًا جدوى البيانات الضعيفة (أيْ: النص غير at eed‏ في أماكن 
مثل قواعد بيانات Lotus Notes‏ أو الملفات النصية على الإنترنت أو الشبكات الداخلية على 
مستوى اطؤسسة). 
- غالبًا ما يكون عامل التنقيب ف البيانات مُستَخدَمًا Gily‏ ويتمُ تمكينه بواسطة مثاقيب البيانات 
وأدوات الاستعلام القوية الأخرى لطرح أسئلة مُخصّصة والحصول على إجابات بسرعة؛ وذلك 
من خلال استخدام مهارة برمجة محدودة أو منعدمة. 
- وكثيرًا ما ينطوي التنقيبٌ المومّع في البيانات على إيجاد نتيجة غير متوقعة» ويتطلب من 
المستخدمين النهائيين التفكيرٌ بصورة إبداعية خلال العمليةء Le‏ في ذلك تفسير النتائج. 
- يتم الجَمْع بين أدوات التنقيب في البيانات بسهولة مع جداول البيانات وأدوات تطوير البرمجيات 
الأخرى. وبالتالي؛ يكن تحليلٌ البيانات المتحصّل عليهاء Us pis‏ بسرعة وسهولة. 
- نظرًا للكميات الكبيرة من البيانات وجهود البحث المكثفة؛ فإنه من الضروري في بعض الأحيان 
استخدام المعالجة المتوازية للتنقيب في البيانات. 
oss‏ للشركة التي تستفيدٌ بشكل JUS‏ من أدوات وتقنيات التنقيب في البيانات؛ الحصول 
على bts‏ تنافسية إستراتيجية والحفاظ عليه ا؛ إذ gd‏ التنقيبُ في البيانات للمنظمات ia‏ 
مُعرّزة لاتخاذ القرارات لاستغلال الفرص الجديدة عن طريق تحويل البيانات إلى سلاح إستراتيجي. 
ولتفاصيل أكثر حول فوائد التنقيب في البيانات انظر: )2001( .Nemati and Barko‏ 
كيف يعمل التنقيب في البيانات؟ 
من خلال استخدام البيانات الحالية ذات AA‏ والتي تم الحصولٌ عليها من داخل وخارج 
المنظمة؛ يستطيع التنقيبٌ في البيانات أن يبني نماذج لاكتشاف الأنماط بين السّمات المعروضة 
في مجموعة البيانات. وهذه النماذجُ هي التمثيلات الرياضية (العلاقات/ الارتباطات الخطية 
البسيطة أو العلاقات المعقّدة وغير الخطية) التي S355‏ الأأماط بين سمات الأشياء (كالعملاء أو 
الأحداث) الموضّحة في مجموعة البيانات. RS‏ الأماط تفسيرية (تشرح العلاقات المتبادلة 
والصّلات بين السّمات)» في حين أن البعض الآخر تنبوئية )23 بالقيّم المستقبلية لبعض السّمات). 
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وبشكلٍ عام؛ فإن التنقيبَ في البيانات يسعى إلى تحديد أربعة أنواع رئيسية فقط من الأنماط: 
-١‏ تحديد الترابط في مجموعات مشتركة من الأشياءء مثل: البيرة والحفاضات تسير Ux‏ في تحليل 

سلة السوق. 
-Y‏ التنبؤات تُوضّح طبيعة الأحداث المستقبلية لأحداث معينة £o‏ على ما حدث في الماضيء مثل: 

التنبؤ بالفائز في Super Bowl‏ أو التنبؤ بالحرارة المطلقة في يوم معين. 
-Y‏ التجميع ويعمل على تحديد ا مجموعات الطبيعية للأشياء استنادًا إلى خصائصها ال معروفة 

مثل: تعبين العملاء في شرائح مختلفة بناءً على التركيبة السكانية وسلوكيات الشراء السابقة. 
-E‏ العلاقات التسلسلية» وتعمل على گشف علاقات الأحداث الزمنيةء مثل التنبؤ ob‏ عميلا 

مصرفيًا موجودًا لديه بالفعل حساب فحص سيفتح حساب توفير متبوعًا بحساب استثمار في 

غضون عام. 

وقد تمّ استخراج هذه الأنواع من الأنماط يدويًا من البيانات من قبل البشر على مدى قرون» 
غير أن تزايد حجم البيانات في العصر الحديث جعل هناك حاجة إلى طرق أكثر تلقائية. ومع ازدياد 
حجم مجموعات البيانات وتعقيدها؛ ازداد التحليل المباشر للبيانات اليدوية 2 z5 JS‏ باستخدام 
أدوات معالجة البيانات الآلية وغير المباشرة التي تستخدم منهجيات وأساليب وخوارزميات 
مُعقدة. 335 JL‏ لمظاهر مثل هذا التطور من الوسائل الأوتوماتيكية وشبه الأوتوماتيكية معالجة 
البيانات الكبيرة باسم التنقيب في البيانات. 

وبشكل tele‏ فإنه هكن تصنيف مهام التنقيب في OLLI‏ إلى ثلاث OLS‏ رئيسيةء هي: التنبق 
والارتباط والتجميع. واستنادًا إلى الطريقة التي يتم بها استخراج الأماط من البيانات التاريخية؛ 
تمكن تصنيف أنظمة e on‏ خوارزميات التنقيب في البيانات إلى التنقيب في البيانات في وجود 
إشراف أو بدون إشراف» وتشتمل بيانات التدريب على JS‏ من الصفات الوصفية xl)‏ المتغيرات 
al Lal‏ أو متغيرات القرار) إضافةٌ إلى خاصية الفئة ss)‏ متغير qr RI‏ أو متغير النتيجة). 
dio‏ المقابل؛ فمع elel‏ بدون إشراف. فإن بيانات التدريب تشمل فقط الصفات الوصفية. 
ويوضح الشكل ١-6‏ تصنيقًا بسيطًا مهام التنقيب في البيانات» جنبًا إلى جنب مع أساليب التعلّم 
والخوازميات الشائعة daga JSI‏ من مهام التنقيب في البيانات. 
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شكل 6-!: تصنيف pleb dadus‏ وطرق وخوارزميات التنقيب في البيانات 

- التنبؤ: يُشار إلى التوقع Boe‏ على أنه إخبارٌ عن المستقبل. وهو يختلف عن التخمين 
البسيط båse‏ أشياءء مثل: مراعاة الخبرات والآراء والمعلومات الأخرى التي لها Lo‏ بالتنبؤ. وهناك 
مصطلحٌ آخر يرتبط Šole‏ مصطلح التنبؤ هو التوفح وعلى الرغم من اعتقاد الكثيرين أن هذين 
المصطلحين مترادفان؛ H‏ هناك اختلاقًا دقيقًا بل حاسماً بين المصطلحين. فالتنبؤ يُستخدّم إلى 35 
كبير في الإشارة إلى الخبرة والرأيء في حين أن التوقع هو البيانات والنموذج القائم. ومن أجل زيادة 
الثقة يكن للمرء أن يدرج المصطلحات التي لها صلةٌ ببعضهاء مثل: التخمينء والتنبؤء والتوقع 
على التوالي. وفي مصطلحات التنقيب في البيانات؛ يتم استخدامٌ التنبؤ والتوقع Bolje JS a‏ 
ويُستخدّم مصطلح التنبؤ باعتباره التمثيل المشترك للفعل. وتبعًا لطبيعة ما يتم التنبؤ به؛ فإنه 
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OSÉ‏ تسمية التنبؤ بش JS‏ أكثر تحديدًا على أنه تصنيفٌ (حيث يكون الثيء الذي يتم Sed‏ به 
مثل: تنبؤات الغد والتي aas‏ حالة الجو إلى «ممطر» أو «مشمس») أو انحدارٌ (حيث يتم التنبق 
بشيء. مثل: درجة حرارة الغد. والتي تكون عبارة عن رقم حقيقيء VO» Jia‏ درجة فهرنهايت»). 

- التصنيف: adis‏ به التصنيف أو الإشراف التعريفي» وهو الأكثر شيوعًا في جميع مهام 
التنقيب في البيانات. والهدف من التصنيف؛ هو ales‏ البيانات التاريخية Aj‏ في قاعدة 
البيانات وإنشاء نموذج 4:4 التنبؤ بالسلوك المستقبلي تلقائيًا. ويتكوّن هذا النموذج ool‏ 
من تعميمات لسجلات مجموعة بيانات التدريب» والتي تساعد على تمييز الفئات المُحدّدة مسبقًا. 
ونأمل أن يُستخدّم هذا النموذج بعد ذلك Sax‏ بفئات السجلات الأخرى غير المصنّفة, والأهم 
من ذلك» للتنبؤ بدقة بالأحداث المستقبلية الفعلية. وتشمل أدوات التصنيف الشائعة: الشبكات 
العصبية وأشجار القرارء والتحليل اللوجستي وتحليل التمييز (من الإحصاءات التقليدية)» 
والأدوات الناشئةء مثل: ا مجموعات الخام» وآلات متجه الدعم (SVMS)‏ والخوارزميات الجينية. 
وقد تلقت تقنيات التصنيف القائمة على الإحصاء (على سبيل المثال: الانحدار اللوجستي وتحليل 
التمييز) نصيبها من الانتقادات - وهي أنها تضع افتراضات غير واقعية حول البيانات» مثل: 
الاستقلالية والوَضْع الطبيعي - مما Aag‏ من استخدامها في مشاريع التنقيب في البيانات من النوع 
التصنيفي. وتنطوي الشبكات العصبية على تطوير هياكل رياضية (تشبه إلى X5‏ ما الشبكات 
العصبية البيولوجية في الدماغ البشري) والتي لديها القدرة على التعلّم من التجارب السابقة 
المقدمة في شكل مجموعات بيانات جيدة التنظيم. فهي تميلٌ إلى أن تكون أكثر فعاليةٌ عندما 
يكون Sae‏ المتغيرات المعنيّة كبي؟ إلى 45 ما والعلاقات فيما بينها معقدة وغير دقيقة. Jam)‏ 
بالذكر أن الشبكات العصبية لها عيوبٌ كما أن لها مزايا. فعلى سبيل المثال: bole‏ ما يكون من 
الصعب للغاية توفير Ob‏ جيدة للتنبؤات التي تقوم بها الشبكة العصبية. إضافة إلى أن 
الشبكات العصبية تحتاج إلى تدريب كبير. ولسوء الحظ؛ فإن الوقت اللازم للتدريب يزداد 
بشكل كبير مع زيادة حجم البيانات» وبشكل tele‏ فإنه لا هكن تدريب الشبكات العصبية على 
قواعد بيانات كبيرة Mor‏ وهذه العوامل وغيرها ساعدت على تحديث إمكانية تطبيق الشبكات 
العصبية في المجالات الغنية بالبيانات. 

وتقوم Sla al‏ القرار بتصنيف البيانات إلى عدد adaa‏ من الفئات SU‏ على o‏ متغيرات الإدخال. 
وأشجار القرار؛ هي في الأماس Gudas‏ هرمي للبيانات ثم تكون أسرع بشكل ملحوظ من الشبكات 
العصبية. فهي أكثر ملاءمةً للبيانات الفئوية والفترة الزمنية. ولذلك؛ فإن دَمْج المتغيرات ا مستمرة في 
إطار شجرة القرارات يتطلب تفكيرًا؛ أيْ: تحويل المتغيرات الرقمية القيّمةَ المستمرة إلى النطاقات والفئات. 
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Gf‏ الفئة ذات ALA‏ من أدوات التصنيف؛ فهي استقراءٌ القاعدة. وهي على عكس شجرة 
القرارء ومع el iz ul‏ القاعدة؛ فإن العبارات حينئذ gas‏ عن بيانات التدريب مباشرة ولا يجب 
أن تكون ذات طبيعة هرمية. وهناك Olud‏ أخرى حديثة SVM Jis‏ ومجموعات صعبة 
وخوارزميات جينية» تَحِد طريقها تدريجيًا إلى ترسانة من خوارزميات التصنيف. 

- التجميع: هو عبارة عن تجميع أقسام مجموعة من الأشياء (على سبيل المثال: «DUIS‏ 
أحداث» معروضة في مجموعة بيانات منظمة) إلى شرائح sl)‏ مجموعات طبيعية) يتشارك أعضاؤها 
في خصائص متشابهة. فهو على عكس التصنيف؛ إذ Ol‏ تجميع تصنيفات الفئات غير معروف. 
وإذ ol‏ الخوارزميات $2 عبر مجموعة البيانات؛ فإن تحديد القواسم المشتركة للأشياء يتم la‏ 
على خصائصهاء ومن ثمّ يتم إنشاءٌ المجموعات. ونظرًا لأن المجموعات يتم تحديدها باستخدام 
خوارزمية من النوع التجريبي؛ ولأن الخوارزميات المختلفة قد تنتهي بمجموعات مختلفة من 
المجموعات لمجموعة البيانات نفسهاء قبل أن يتم وضع نتائج تقنيات التجميع للاستخدام الفعلي؛ 
فقد يكون من الضروري وجود خبير لتفسيرء وربما تعديلء المجموعات المقترحة. وبعد تحديد 
المجموعات ال معقولةء هكن استخدامها لتصنيف وتفسير البيانات الجديدة. 


وليس من المُستَغْرَب أن تشتمل تقنيات التجميع على تحقيق الدرجة المثلى. والهدف من 
التجميع هو إنشاء مجموعات؛ بحيث يكون للأعضاء داخل JS‏ مجموعة أقصى درجة من التشابه 
والأعضاء عبر المجموعات لديهم d Ul‏ الأدنى من التشابه. وتتضمّن تقنيات التجميع الأكثر 
استخدامًا وسائل k‏ (من الإحصائيات) وخرائط التنظيم الذاتي (من تعلّم (III‏ وهي بنيةٌ فريدة 
للشبكة العصبية طوّرها )1982( Kohonen‏ 





وغالبًا ما تستخدم الشركات بفاعلية eli‏ التنقيب في البيانات لديها؛ لإجراء التجزئة في السوق 
مع التحليل التجميعي. وتحليل المجموعة؛ 385 dle Lus‏ لتحديد فنات العناصر؛ بحيث تكون 
العناصرٌ الموجودة في مجموعة مشتركة بعضها مع بعض بش JS‏ أكبر من العناصر الموجودة في 
مجموعات أخرى. GSI‏ استخدامه في تقسيم العملاء وتوجيه المنتجات التسويقية المناسبة 
إلى الشرائح في الوقت المناسب وبالشكل المناسب وبالسعر المناسب. plaus‏ تحليل ا مجموعة 
أيضًا؛ لتحديد التجمُعات الطبيعية للأحداث أو الكائنات؛ بحيث يمكن daos‏ مجموعة مشتركة 
من سمات هذه المجموعات لوصفها. 

- الاقتران: إِنَّ الجمعيات. أو els‏ قواعد الترابط في التنقيب في البيانات؛ تقنيةٌ شائعةٌ ومدروسة 
جيدًا لاكتشاف العلاقات المثيرة بين المتغيّرات في قواعد البيانات الكبيرة. وبفضل تقنيات جَمْعَ 
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البيانات AY‏ مثل: ماسحات الباركود؛ فإن استخدام قواعد hi‏ لاكتشاف الإجراءات المنتظمة 
بين المنتجات في المعاملات الكبيرة التي سجّلتها أنظمة نقاط البيع في محلات السوبر ماركت أصبحت 
daga‏ في اكتشاف معرفة مشتركة في صناعة البيع بالتجزئة. وفي سياق صناعة البيع بالتجزئة. غالبًا 
ما alles‏ على الاستخراج الخاص بقواعد الارتباطات: ddos‏ السوق. وهناك اثنان من المشتقات 
الشائعة الاستخدام؛ وهما: رابطة الاستخراج من القاعدة وتحليل الارتباط وتسلسل الاستخراج. 
وباستخدام تحليل الارتباطات» ex‏ اكتشاف الارتباط بين العديد من الأشياء ذات الأهمية DU‏ 
مشل الارتباط بين صفحات الويب والعلاقات المرجعية بين مجموعات مؤلفي النشرات الأكادهية. 
ومع الاستخراج التسلسلي؛ يتم قَخص العلاقات؛ من حيث ترتيب حدوثها لتحديد الجمعيات مع 
مرور الوقت. وتتضمّن الخوارزميات امُستخدّمة في استخراج القاعدة المشتركة Apriori‏ الشهير 
(حيث يتم التعرّف على العناصر اللتكرّرة) .Eclatg ZeroRg «OneRو .FP-Growths‏ 

التصويرٌ Sells‏ بالسلسلة الزمنية؛ هناك تقنيتان ترتبطان في الغالب بالتنقيب في البيانات؛ 
وهما التصويرٌ والتنبؤ بالسّاسلة aal‏ ويمكن استخدامٌ التمثيل المرئي بالاقتران مع تقنيات 
التنقيب في البيانات الأخرى؛ للحصول على فَهْم أكثر وضوحًا للعلاقات الأساسية. ومع ازدياد 
أهمية التصوير في السنوات الأخيرة؛ jab‏ مصطلحٌ cuu‏ وهو التحليلات المرئية. وتكمُّنُ الفكرة 
في gazd‏ بين التحليلات والتصوير في بيئة واحدة لتسهيل إنشاء ا معرفة بشكلٍ أسهل وأسرع. وقد 
تمّ تغطية التحليلات المرئية بالتفصيل في الفصل Y‏ وف توقع السلسلة الزمنية؛ تتكوّن البيانات 
من sil e$‏ نفسه الذي يتم التقاطه وتخزينه مع مرور الوقت في فواصل زمنية منتظمة. ثم 
يتم استخدام هذه البيانات لتطوير نماذج التوقع لاستقراء القيم المستقبلية للمتغير نفسه. 


التنقيب في البيانات مقابل الإحصاءات: 

هناك الكثيرٌ من القواسم المشتركة بين التنقيب في البيانات والإحصاءات. فكلاهما يبحث عن 
العلاقات داخل البيانات. ومعظم الناس يتصلون بالإحصائيات «أساس التنقيب في البيانات». 
والفرق الرئيس بين الاثنين؛ هو أن الإحصائيات تبدأ بفرضية مُحدّدة بدقة؛ في حين تبدأ عملية 
التنقيب في البيانات ببيان اكتشاف غير مُحدَّد المعالم. وتجمع الإحصائيات بيانات عينة (أَيْ: 
بيانات أولية) لاختبار الفرضيةء في حين أن التنقيب في البيانات والتحليلات تستخدم جميع البيانات 
الموجودة sl)‏ البيانات الثانوية الملاحظة في الغالب) لاكتشاف أنماط وعلاقات جديدة. Jlag‏ 
فرق آخر db‏ من حجم البيانات التي يستخدمونها؛ إذ يبحث التنقيب في البيانات عن مجموعات 
البيانات «الكبيرة» قدر الإمكان؛ في حين تبحث الإحصائيات عن الحجم الصحيح للبيانات (إذا 
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كانت البيانات أكبر من المطلوب/ المطلوب للتحليل flay‏ يتم استخدام عينة من البيانات). 
ol‏ معنى «البيانات الضخمة» يختلف إلى A‏ ما بين الإحصاءات والتنقيب في البيانات. وهناك 
القليلُ من المئات إلى الآلاف من نقاط البيانات الكبيرة ها يكفي للتحليل الإحصائيء غير أنَّ bis‏ 
ملايين إلى بضع مليارات من نقاط البيانات iS‏ كبيرةً بالنسبة لدراسات التنقيب في البيانات. 


حالة عملية Y-£‏ 
احتفاظ شركة Dell‏ بذكاء وفعالية تحليلاتها في القرن الحادي والعشرين 

لقد غيّرت الثورة الرقمية كيفية تسوق الناس؛ إذ تشير الدراسات إلى أنه حتى 
العملاء التجاريين يستخدمون do V‏ من حلول البحث عن رحلة الشراء الخاصة بهم 
عبر الإنترنت قبل ارتباطهم ببائع. ومن أجل التنافس؛ فإن بعض الشركات» مثل: شركة 
Dell‏ تقوم بتحويل نماذج المبيعات والتسويق لدعم هذه المتطلبات الجديدة. ومع 
ذلك؛ فإن القيام بهذا الأمر على نحو فعّال يتطلب حل «البيانات الكبيرة» والذي 45 
تحليل قواعد بيانات الشركات جنبًا إلى جنب مع معلومات غير منظمة من مصادر مثل 
clickstreams‏ والشبكات الاجتماعية. 

لقد تطوّرت Dell‏ لتصبح bush‏ في مجال التقنية من خلال استخدام العمليات 
d I‏ القائمة على البيانات؛ إذ -SÅ‏ للموظفين الحصولٌ على نتائج قابلة للقياس 
لعقود قادمة من الزمان؛ وذلك من خلال استخدام تطبيقات المؤسسات لدعم الرؤية 
وتسهيل العمليات» مثل: إدارة علاقات العملاء (CRM)‏ وال مبيعات والمحاسبة. وعندما 
أدركت Dell‏ أن العملاء يقضون وقنًا أطول في البحث عن المنتجات عبر الإنترنت قبل 
الاتصال بمندوب مبيعات؛ أرادت تحديث النماذج التسويقية وفقًا لذلك؛ بحيث YS‏ 
تقديم الأنواع الجديدة من الخدمات المخصّصة والدعم الذي يتوقعه العملاء. لإجراء 
هذه التغييرات» ويحتاج موظفو التسويق إلى المزيد من البيانات حول سلوك العملاء 
عبر الإنترنت. كما يحتاج الموظفون إلى طريقة أسهل لتضييق الرؤية من خلال العديد 
من أدوات ذكاء الأعمال ومصادر البيانات. وقد ذكر Drew Miller‏ المدير التنفيذي 
لتحليلات السوق والأفكار في Dell‏ أن: «هناك العديدَ من المعلومات المتاحة عن 
عادات التسوق عبر الإنترنت وخارج الإنترنت للعملاء. نحن بحاجة فقط إلى إعطاء 
موظفي التسويق حلا سهل الاستخدام «i$‏ استيعاب كل eUS‏ وتحديد الأنماط وتقديم 
توصيات حول الإنفاق على التسويق والأنشطة». 
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إنشاء فريق $5( لتعزيز عائد الاستثمار (ROI)‏ باستخدام ذكاء الأعمال والتحليلات: 
ومن أجل تحسين إستراتيجية ذكاء الأعمال والتحليلات والاتصالات العاللية؛ فقد 
أنشأت Dell‏ فريقًا مهمًا لتقنية المعلومات. كما Lol‏ المديرون التنفيذيون نموذجًا ذكيًا 
للحوكمة في الفريق؛ حتى يتمكّن من الاستجابة بسرعة بلتطلبات ذكاء الأعمال المتطورة 
للموظفين ومتطلبات التحليلات وتقديم عائد استثمار سريع. فعلى سبيل المثال: نجد أنه 
إضافة إلى امتلاك حرية التعاون مع مجموع ات الأعمال الداخلية؛ فإنه يتم تمكين فريق 
العمل من تعديل الأعمال وعمليات تقنية المعلومات باستخدام الإستراتيجيات الذكية 
والمبتكرة. كما cano‏ أن يكرّس الفريق أكثر من “0٠‏ من جهوده لتحديد وتنفيذ المكاسب 
السريعة لذكاء الأعمال ومشاريع التحليلات التي Bale.‏ ما تكون صغيرة là) ddl "i‏ 
أولويات «A»‏ بقسم تقنية المعلومات في Dell‏ كما يجب على الفريق أيضًا أن ينفق ما 
لايقل عن >١‏ من وقته في التبشير داخل مجموعات الأعمال الداخلية pe‏ مستوى 
الوعي حول التحويلات التي تتمتع بها ذكاء الأعمال - as‏ عن الفرص ال متاحة للتعاون. 


وقد كان Sol‏ المشروعات الأولى لفريق العمل؛ هو إيجاد de‏ جديد لبراءات الاختراع 
والتحليل يُعرف باسم Workbench Analytics‏ وقد رگز تطبيقه المبدئي على مجموعة 
مختارة من حالات الاستخدام حول ارتباطات العملاء التجاريين عبر الإنترنت وخارجها. 
وقد تم دَعْم هذا المجهود من قبل مؤسسات تقنية المعلومات والتسويق في Dell‏ 
يقول Fadi Taffal‏ مدير شركة تقنية المعلومات في شركة :Dell‏ «كانت هناك ii‏ في 
توسيع نطاق استخدام هذ! الحل لدعم العديد من أنشطة المبيعات والتسويق في أقرب 
uds‏ ممكن. ومع ذلك؛ كنا نعلم أننا نستطيع بناء Jo‏ أكثر فعالية إذا قمنا بتطويره 
من خلال الجهود السريعة المتسارعة». 
سوق معلومات واحد ضخم (One Massive Data Mart)‏ لتسهيل مصدر واحد للحقيقة: 

ومن خلال العمل بجدية مع التسويق؛ فإن مهندس و فريق العمل يستخدمون 
إستراتيجيات تطوير البرمجيات الضعيفة» والعديد من التقنيات لإنشاء سوق بيانات dB‏ 
gái‏ بشكلٍ كبير؛ إذ يستخدم dl‏ الشامل العدية من التقنيات والأدوات لتمكين 
أنواع مختلفة من مستودعات البيانات» والمعالجة البارعة. وأنشطة التشغيل الآلي. فعلى 
سبيل المثال: يقوم ا مهندسون بمستودعات البيانات غير المُنظمة من مصادر الوثائق 
الرقمية/ الاجتماعية على الخوادم التي تقوم بتشغيل ò$ Apache Hadoop‏ يستخدمون 
صيغة ‘Teradata Aster‏ لدَمُج واستكشاف كميات كبيرة من بيانات العملاء من مصادر 
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أخرى Ki‏ فوري. وبالنسبة للعديد من متطلبات تحويل البيانات والتشغيل الآلي؛ 
$t‏ الحلّ يتضمّن استخدام برمجيات Toad‏ من Dell‏ وتحديدًا ‘Toad Data Point‏ 
«Toad Intelligence Centralg‏ إضافة إلى Dell Statistica‏ إذ توفر برمجية Toad‏ 
das Data Point‏ ملائمةٌ للأعمال iztek‏ البيانات والتشغيل «JV‏ وهي فجوةٌ Aer‏ 
في النظام البيئي. وبالنسبة للنماذج التحليلية المتقدّمة؛ فإن النظام يستخدم Dell‏ 
«Statistica‏ والذي يوفر إعداد البيانات والتحليلات التنبؤية واستخلاص البيانات والتعرُف 
«JV‏ والإحصاءات» وتحليلات النصوص. والتوقيع والإبلاغ» ونشر النموذج ومراقبته. 
ويستفيد ا مهندس ون Ud]‏ من هذا الحل لتطوير نماذج تحليلية يكن من خلالها فحص 
جميع البيانات المتباينة وتقديم صورة دقيقة لسلوك التسوق لدى العملاء. وتوفر 
الأدوات اقتراحات لتحسين الخدمة؛ إضافةً إلى مقاييس عائد الاستثمار لإستراتيجيات 
siss‏ ا منتجات التي تشمل التسويق عبر الويب واممكاممات الهاتفية وزيارات المواقع. 

ds‏ غضون ös‏ أشهر كان المهندسون يستخدمون منضدة التحليلات التسويقية 
لأولية. كما قامت فرقة العمل بالتخطيط لتوسيع إمكانات الحلّ حتى تتمكّن من 
تحليل البيانات من مصادر أكثر. وتقديم تصورات إضافيةء وقياس عوائد أنشطة 
لقنوات الأخرىء مثل: التغريدات. والنصوص, ورسائل البريد الإلكترونيء ومشاركات 
وسائل الإعلام الاجتماعية. 





توفير أكثر من 7,5 مليار دولار في التكاليف التشغيلية: 

ومن خلال الحلول الجديدة؛ فقد قامت شركة Dell‏ بالفعل بإزالة العديد من تطبيقات 
ذكاء الأعمال الخاصة بطرف ثالث. وقد ذكر Chaitanya Laxminarayana‏ مدير برنامج 
التسويق في شركة Dell‏ أنه: «على الرغم من أننا في المراحل الأولى من طرح منبر التسويق 
التحليلي؛ فإننا وفرنا حوالي ۲۵ مليون دولار في تكاليف الاستعانة بمصادر خارجية للموزدين». 
«و ET‏ إلى ذلك؛ Jas‏ الموظفون على إحصاءات أسرع وأكثر تفصيلًا». ونظرًا لأن Dell‏ 
تقوم بتحجيم نطاق تحليل التسويق؛ فإنها ستعمل على galal‏ التدريجي من تطبيقات 
ذكاء الأعمال الأخرى التابعة لجهات خارجية؛ مما يقلل من التكاليف 3553s‏ الكفاءة. 

تسهيل ٥,۳‏ مليون دولار في الإيرادات: 


gian‏ موظفو التسويق الآن بالرؤية التي يحتاجون إليها لتحديد الاتجاهات الناشئة 
في ارتباطات العملاء وتحديث النماذج وفقًا لذلك. وقد ذكر Laxman Srigirl‏ مدير 


ren‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 


قسم التحليلات التسويقية في شركة :Dell‏ «لقد حققنا بالفعل OY‏ مليون دولار 
كإيرادات متزايدة من خلال إطلاق برامج تسويقية أكثر تخصيصًا وكشف فرص جديدة 
من خلال قاعدة البيانات الكبيرة لتحليلات التسويق». «إضافةً إلى ذلك؛ لدينا برامج في 
مسارها لتوسيع نطاق هذا التأثير čie‏ مرات في إلسنوات الثلاث المقبلة». 

وعلى سبيل المثال: يكن للموظفين الآن مشاهدة جدول زمني لتفاعلات العميل عبر 
الإنترنت وبدون اتصال مع Dell‏ ما في ذلك عمليات الشراء وصفحات Dell‏ الخاصة بموقع 
الويب التي زارها العميل, والملفات التي قاموا بتنزيلها. وإضافةً إلى ذلك؛ يتلقى الموظفون 
اقتراحات لقواعد البيانات؛ لمعرفة وقت وكيفية الاتصال بأحد العملاء؛ إضافةٌ إلى عناوين 
URL‏ لصفحات محدّدة ينبغي عليهم قراءتها لمعرفة المزيد عن التقنيات التي يبحث عنها 
العميل. يقول :Srigiri‏ «كان من الضروري أن نفهم المتطلبات المتغيّرة؛ حتى نتمكن من 
الحفاظ على ذكائنا. والآن بعد أن أصبح لدينا هذه الرؤية؛ يمكننا بسرعة تطوير نماذج 
تسويقية أكثر delà‏ توفر ا معلومات المخصّصة والدعم الذي يتوقعه العملاء». 

أسئلة للمناقشة: 

-١‏ ما هو التحَذَّي الذي واجهته «Dell‏ والذي 5l‏ إلى رحلة تحليلاتها؟ 

-Y‏ ما هو dol‏ الذي قامت شركة Dell‏ بتطويره وتنفيذه؟ وماذا كانت النتائج؟ 

-Y‏ كشركة التحليلات نفسهاء استخدمت Dell‏ عروض خدماتها لأعمالها الخاصة 
هل تعتقد أنه من الأسهل أو الأصعب على الشركة تذوق الدواء الخاص بها؟ وصح ذلك. 
Source: Dell: Staying agile and effective in the 21st century. Dell Case Study, software.‏ 


dell.com/casestudy/dell-staying -agile-and- — effective-in-the-21st-century881389. 


Used by permission from Dell. 


أسئلة للمراجعة على قسم :۲-٤‏ 

-١‏ عرف التنقيب في البيانات. واذكر اذا يُوجَّد العديدٌ من الأسماء والتعريفات المختلفة للتنقيب في البيانات؟ 
-Y‏ ما هي العوامل الأخيرة التي زادت من شعبية التنقيب في البيانات؟ 

i Ja -Y‏ التنقيبٌ في البيانات تخصصاً جديداً؟ وضح ذلك. 

-E‏ اذكر بعض الطرق الرئيسة وخوارزميات التنقيب في البيانات؟ 

0- ما هي الاختلافات الأساسية بين els‏ الرئيسة للتنقيب في البيانات؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yev‏ 


الفصل الرابع 


Y-t‏ تطبيقات التنقيب في البيانات: 
لقد أصبح التنقيبٌ في البيانات lol‏ شائعةً في معالجة العديد من المشكلات والفرص التجارية 
المعقدة. وقد ثبت أنه Rb‏ للغاية ومفيدٌ في العديد من المجالات» وبعضها AA‏ في الأمثلة 
التمثيلية التالية. والهدف من العديد من تطبيقات التنقيب ف البيانات التجارية؛ هو حل مشكلة 
sls‏ أو استكشاف فرصة عمل ناشئة لخلق 83:5 تنافسية EUN‏ 
- إدارة علاقات العملاء: إدارة علاقات العملاء (CRM)‏ هي امتدادٌ التسويق التقليدي. ويتمثل 
الهدف من إدارة علاقات العملاء CRM‏ في إنشاء علاقات فردية مع العملاء من خلال تطوير 
الفهم الدقيق لاحتياجاتهم ورغباتهم. ومع قيام الشركات ببناء علاقات مع عملائها مرور 
الوقت من خلال مجموعة متنوعة من التفاعلات (مثل: استفسارات المنتج والمبيعات» وطلبات 
الخدمةء ومكاطمات الضمانء ومراجعات المنتجات. واتصالات وسائل التواصل الاجتماعي)؛ 
فإنها تجمع كميات Ála‏ من البيانات. وعند الجمع بين السّمات الدهوغرافية والاجتماعية 
والاقتصادية» يمكن استخدام هذه البيانات الزاخرة با معلومات من أجل: 
-١‏ تحديد المستجيبين/ المستفيدين المحتملين للمنتجات/ الخدمات الجديدة (كتصنيف العملاء). 
-Y‏ فهم الأسباب الجذرية لاستنزاف العملاء؛ لتحسين استبقاء العملاء (أيْ: تحليل التغيير). 
-Y‏ اكتشاف ارتباطات متغيّر الوقت بين المنتجات والخدمات؛ لتحقيق أقصى قدرٍ من المبيعات 
والقيمة للعملاء. 
-E‏ تحديد العملاء الأكثر ربحيةً واحتياجاتهم التفضيلية؛ لتعزيز العلاقات وزيادة المبيعات. 
- الخدمات المصرفية: يستطيع التنقيبُ في البيانات أن يساعدّ البنوك على القيام ها يلي: 
-١‏ أتمتة عملية طلب القرض من خلال التنبؤ الدقيق للمستفيدين الأكثر احتمالاً للتعثر. 
-Y‏ كشف بطاقات الائتمان المزوّرة والمعاملات المصرفية عبر الإنترنت. 
-Y‏ تحديد سبل تعظيم قيمة العميل عن طريق gi‏ المنتجات والخدمات التي من gd‏ أن 
يقوموا بشرائها. 
-E‏ تحسين العائد النقدي؛ من خلال Sax]‏ بدقة بالتدفق النقدي على الكيانات المصرفية (مثل: 
أجهزة الصراف qi‏ الفر وع المصرفية). ١‏ 
- البَيْع بالتجزئة والنقل والإمداد: في صناعة البيع بالتجزئة؛ هكن استخدام التنقيب في البيانات في: 
-١‏ التنبؤ بحجم مبيعات دقيقة في مواقع البيع بالتجزئة المحَدَّدة لتحديد مستويات المخزون الصحيح. 
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-Y‏ تحديد علاقات المبيعات بين المنتجات المختلفة ga)‏ تحليل سلة السوق)؛ من أجل تحسين 
تخطيط المتجر وتحسين ترويج lel‏ 

-Y‏ مستويات الاستهلاك المتوقعة من أنواع مختلفة من المنتجات (على أساس الظروف الموسمية 
والبيئية) لتحسين JAN‏ والإمدادء وبالتالي زيادة الطبيعات. 

-t‏ اكتشاف أنماط مثيرة للاهتمام في حركة المنتجات (خاصةً بالنسبة للمنتجات التي لها فترة 
صلاحية محدودة؛ لأنها 25s‏ لانقضاء الصلاحية وقابلية الاستخدام والتلوث) في سلسلة 
التوريد من خلال تحليل بيانات التعرّف على الترددات اللاسلكية والحسية (RFID)‏ 

- التصنيع والإنتاج: يكن للمصنّعين استخدامٌ التنقيب في البيانات JS)‏ من: 
-١‏ التنبؤ بفشل الآلات قبل حدوثها؛ من خلال استخدام البيانات الحسية (تمكين ما يُسمّى 
الصيانة المستندة إلى الشروط). 
-Y‏ تحديد الشذوذ والقواسم المشتركة في نظم الإنتاج؛ لتحسين القدرة التصنيعية. 
-Y‏ اكتشاف أنماط جديدة؛ لتحديد وتحسين جودة المنتج. 
- السّمسرة وتداول الأوراق المالية: يَستخدم الوسطاءٌ والتجارٌ التنقيب في البيانات؛ من أجل: 
-١‏ التنبؤ بوقت ومقدار تغيّر أسعار السّندات. 
-Y‏ التنبق بنطاق واتجاه coulis‏ الأسهم. 
-Y‏ تقييم تأثير قضايا وأحداث مُعيّنة على حركات السوق JSS‏ 
-E‏ تحديد eias‏ الأنشطة الاحتيالية في تداول الأوراق AJU‏ 
- التأمين: تستخدم صناعة التأمين تقنيات التنقيب في البيانات؛ من أجل: 

-١‏ توفع مبالغ المطالبة الخاصة بتكاليف الملكية والتغطية الطبية؛ لتحسين خطط الأعمال. 

-Y‏ تحديد خطط الأسعار UL‏ على أساس تحليل المطالبات وبيانات العملاء. 

-Y‏ التنبؤ بالعملاء الأكثر احتمالًا لشراء سياسات جديدة ذات سمات خاصة. 

-é‏ تحديد mias‏ مدفوعات المطالبة غير الصحيحة والأنشطة الاحتيالية. 

- أجهزة الحاسب والبرمجيات: GSE‏ استخدامُ التنقيب في البيانات في: 

-١‏ توقع حالات فشل مُحرك الأقراص قبل حدوثها فعليًا. 

-Y‏ تحديد وتصفية محتوى الويب غير المرغوب فيه ورسائل البريد الإلكتروني. 

-Y‏ اكتشاف eias‏ ثغرات أمن شبكات الحاسب. 
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-E‏ تحديد منتجات البرمجيات غير الآمنة. 
- الحكومة والدفاع: يحتوي التنقيبٌ في البيانات Lá‏ على عدد من التطبيقات العسكرية. حيث 
يمكن استخدامه في: 
-١‏ توقع تكاليف نقل الأفراد والمعدَّات العسكرية. 
-Y‏ التنبق بحركات الخَصّمء Jbg‏ تطوير إستراتيجيات أكثر نجاحًا للارتباطات العسكرية. 
-Y‏ التنبق باستهلاك الموارد؛ لتحسين التخطيط واطيزانية. 
-E‏ تحديد فئات من التجارب والإستراتيجيات والدروس المستفادة من العمليات العسكرية 

لتبادل المعرفة بشكلٍ أفضل في جميع أنحاء المنظمة. 

- صناعة السفر (شركات الطيران» الفنادق/ المنتجعات, شركات تأجير السيارات): piás‏ 

التنقيب في البيانات في العديد من مجالات صناعة السفر؛ إذ يتم استخدامها بنجاح في: 

2I -١‏ $ بمبيعات الخدمات المختلفة (أنواع المقاعد في الطائرات» أنواع الغرف في 
الفنادق/ المنتجعاتء أنواع السيارات في شركات تأجير السيارات)؛ من أجل تسعير الخدمات 
على النحو الأمثل لزيادة الإيرادات إلى أقصى ÁS‏ كدالة للمعاملات المتغيرة مع الوقت (يُشار 
إليها bole‏ باسم إدارة العائد). 

-Y‏ توفع الطلب في مواقع مختلفة؛ من أجل تخصيص موارد تنظيمية محدودة بشكل أفضل. 
-Y‏ تحديد العملاء الأكثر ربحيةً وتزويدهم بالخدمات الشخصية؛ للحفاظ على أعمالهم المتكررة. 
-E‏ الاحتفاظ بالموظفين القيّمين من خلال تحديد الأسباب الجذرية التي تؤدي إلى تناقص 
العملاء والتصرّف Fla‏ على ذلك. 

- الرعاية الصحية: يحتوي التنقيبٌ في البيانات على عدد من تطبيقات الرعاية الصحية؛ إذ يمكن 
استخدامه في: 
-١‏ تحديد الأشخاص الذين ليس لديهم irab‏ صحي والعوامل الكامنة وراء هذه الظاهرة غير المرغوبة. 
-Y‏ تحديد علاقات التكلفة/ الفائدة الجديدة بين المعالجات اممختلفة لتطوير إستراتيجيات أكثر فعالية. 
-Y‏ توفع مستوى ووقت الطلب في مواقع الخدمة المختلفة؛ لتخصيص الموارد التنظيمية على النحو الأمثل. 
-E‏ فهم الأسباب الكامنة وراء تناقص العملاء والموظفين. 

- الدواء: يجب النظرٌ إلى استخدام التنقيب في البيانات في الطب باعتباره مكملًا قيمًا للبحوث الطبية 
التقليدية. والتي هي Lal‏ سريرية وبيولوجية في الطبيعة؛ إذ يمكن لتحليلات التنقيب في البيانات: 
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-١‏ تحديد أنماط جديدة لتحسين قابلية بقاء المرضى المصابين بالسرطان. 
-Y‏ التنبق بمعدلات نجاح مرضى زرع الأعضاء لتطوير سياسات مطابقة أفضل للأعضاء. 
-Y‏ تحديد وظائف الجينات المختلفة في الكروموسوم البشري (المعروف باسم ele‏ الجينات). 
€- اكتشاف العلاقات بين الأعراض والأمراض (وكذلك الأمراض والعلاجات الناجحة) لمساعدة 
المهنيين الطبيين في اتخاذ قرارات مستنيرة وصحيحة في الوقت المناسب. 
- صناعة أو مجال التسلية والترفيه: تستخدم صناعة الترفيه بنجاح عملية التنقيب في البيانات في: 
-١‏ تحليل بيانات المشاهد؛ لتحديد البرامج التي يتم عرضها خلال وقت الذروة. وكيفية زيادة 
العائد من خلال معرفة مكان إدراج الإعلانات. 
-Y‏ توقع النجاح CU‏ للأفلام قبل أن يتم إنتاجها؛ لاتخاذ قرارات استثمارية وتحسين العائدات. 
-Y‏ التنبؤ بالطلب في أماكن مختلفة وأوقات مختلفة؛ من أجل تحديد مواعيد أفضل للأحداث 
الترفيهية وتخصيص الموارد على النحو الأمثل. 
-E‏ وَضع سياسات تسعير مثالية لزيادة الإيرادات. 
- الأمن الداخايء وتنفيذ القانون: يحتوي التنقيب في البيانات على عدد من تطبيقات أمن 
الأراضي وتطبيق القانون. وغالبًا ما يتم استخدام التنقيب في البيانات في: 
-١‏ تحديد أنماط السلوكيات الإرهابيةء (وللحصول على مثالٍ على استخدام التنقيب في البيانات 
لتتبّع Joë‏ أنشطة الإرهابيين» انظر: الحالة العملية €( 
-Y‏ اكتشاف أنماط الجرهة (مثل: المواقع» والتوقيت» والسلوك الإجرامي» والسّمات الأخرى ذات 
الصّلة)؛ للمساعدة في Jó‏ القضايا الجنائية في الوقت المناسب. 
-Y‏ التنبؤ بالهجمات البيولوجية والكيميائية المحتملة على البنية التحتية الحيوية للأمة والقضاء 
عليها عن طريق تحليل البيانات الحسّية ذات الأغراض الخاصة. 
-é‏ تحديد وإيقاف الهجمات الضارة على الهياكل الأساسية الحيوية للمعلومات (غالبًا ما تسمّى 
حرب المعلومات). 
- الرياضات: يُستخدم التنقيبٌ في البيانات لتحسين أداء فرق الرابطة الوطنية لكرة السلة 
(NBA)‏ في الولايات المتحدة؛ إذ تستخدم فرق البيسبول الرئيسية في الدوري التحليلات 
التنبؤية والتنقيب في البيانات؛ للاستفادة على النحو الأمثل من مواردها المحدودة 
لموسم الفوز (انظر: مقالة Moneyball‏ في الفصل الأول). وفي الواقع؛ فإن معظم - إن 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yo‏ 


الفصل الرابع 


لم يكن كل - الرياضات dé jl]‏ في الوقت الحاضر توظف خبراء البيانات كما تستخدم التنقيب 
في البيانات لزيادة فرصهم في الفوز. ولا تقتصر تطبيقات التنقيب في البيانات على الرياضات 
الاحترافية. ففي مقالة عام ۲۰۱۲م؛ قام JS‏ من Cogdells Delen‏ و(2012) Kasap‏ بتطوير 
نماذج التنقيب في البيانات للتنبؤ بنتائج الرابطة الرياضية الجامعية الوطنية (NCAA)‏ ونتائج 
لعبة الكرة باستخدام مجموعة واسعة من اللتغيرات حول إحصائيات الألعاب السابقة للفريقين 
المتعارضين ija)‏ من التفاصيل حول هذا يتم توفير دراسة الحالة في الفصل الثاني). وقد 
استخدم )2012( Wright‏ مجموعة egiie‏ من المتنبئين لفحص دوري بطولة كرة LII‏ 


للرجال في الرابطة الوطنية لأمريكا الشمالية .(a.k.a. March Madness)‏ 


حالة عملية ۲-٤‏ 
التحليل التنبؤي والتنقيب في البيانات يساعدٌُ في وقف مويل الإرهاب 

a Si‏ الهجومٌ الإرهابي على مركز التجارة العالمي في ١١‏ سبتمبر 01٠/م,‏ على أهمية 
الذكاء المفتوح المصدر. وقد أعلن قانون الوطنية الأمريكية وإنشاء وزارة الأمن الداخلي 
الأمريكية عن احتمالية لتطبيق تقنية ا معلومات وتقنيات التنقيب في البيانات؛ للكشف 
عن غسيل الأموال والأشكال الأخرى لتمويل الإرهاب. وتركّز وكالات إنفاذ القانون 
على أنشطة غسل الأموال عن طريق ال معاملات العادية من خلال المصارف وغيرها من 
منظمات الخدمات المالية. X35‏ وكالات إنفاذ القانون الآن على تسعير التجارة الدولية 
كأداة لتمويل الإرهاب. وقد استخدم تجار غسيل الأموال التجارة الدولية؛ لنقل الأموال 
بصمت خارج البلاد دون جذب انتباه الحكومة. يتم تحقيق هذا التحويل عن طريق 
المبالغة في تقدير الواردات وانخفاض قيمة الصادرات. فمثلًا هكن للمستورد المحلي 
والمُصَدّر الأجنبي أن يشكلا شراكةً ويتجاوزا قيمة الواردات» وبالتالي تحويل الأموال من 
البلد الأم؛ مما يؤدي إلى جرائم تتعلق بالاحتيال الجمريء cadis‏ من ضريبة الدخلء 
وغسيل الأموال. ويمكن أن يكون yall‏ الأجنبي عضوًا في منظمة إرهابية. 

وترگز تقنيات التنقيب في البيانات على تحليل البيانات المتعلّقة بمعاملات الاستيراد 
والتصدير من وزارة التجارة الأمريكية والكيانات المرتبطة بالتجارة. ويتم تتبّع أسعار 
الواردات التي تتجاوز الحَدّ الأقصى لأمعار الواردات ربع السنويةء وأسعار التصدير 
التي تقل عن الحَد الأدنى من أسعار التصدير ربع السنوية. وينصبٌ التركيز على 
أسعار التحويل غير الطبيعية بين الجلسات التي قد تؤدي إلى تحويل الدخل والضرائب 
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الخاضعة للضريبة من الولايات المتحدة. وقد يكون الانحراف المرصود في الأمعار ناتجًا 
عن تجنّب/ oha‏ ضريبة دخلء أو غسيل أموال أو تمويل إرهاب. وقد يرجع الانحراف 
السعري المرصود Ue]‏ إلى خطأ في قاعدة بيانات التجارة الأمريكية. 

وجديرٌ بالذّكر Bl‏ التنقيب في البيانات سوف يؤدي إلى تقييم UIS‏ للبيانات» وهو 
ما سيساعد بدوره في مكافحة الإرهاب. كما هكن أن ggas‏ تطبيق تقنية المعلومات 
وتقنيات التنقيب في البيانات في المعاملات المالية في تحسين المعلومات الاستخبارية. 

أسئلة للمناقشة: 

-١‏ كيف GSE‏ استخدامٌ التنقيب في البيانات لمكافحة الإرهاب؟ اذكر ما GS‏ القيامُ 
به أيضًا غير ما تضمّنته هذه الحالة العملية. 

-Y‏ هل تعتقد أن التنقيب في البيانات» رغم أنه ضروريّ لمحاربة الخلايا الإرهابيةء 
يُهدّد أيضًا حقوق الأفراد في الخصوصية؟ 
Sources: Zdanowic, [. S. (2004, May). Detecting money laundering and terrorist‏ 


financing via data mining. Communications of the ACM, 47(5), 53; Bolton, R. J. 
(2002, January). Statistical fraud detection: A review. Statistical Science, 17(3), 235. 


أسئلة للمراجعة على القسم Y-E‏ 

-١‏ ما هي مجالات التطبيق الرئيسة للتنقيب في البيانات؟ 

-Y‏ 235 على الأقل خمسة تطبيقات مُحدّدة للتنقيب في البيانات» واذكر خمسة تصنيفات مشتركة 
لهذه التطبيقات. 

۴- ما هو برأيك Diss‏ التطبيق الأبرز للتنقيب في البيانات؟ lbg‏ 

-٤‏ هل كنك التفكيرٌ في مجالات تطبيق أخرى للتنقيب في البيانات لم تتم مناقشتها في هذا 
القسم؟ وضح. 


€-€ عملية التنقيب فى البيانات: 


ole‏ ما يتم اتباع طريقة شائعة للقيام مشاريع التنقيب في البيانات بشكل منهجي. واستنادًا 
إلى أفضل الممارسات؟ قام الباحثون والممارسون في مجال التنقيب في البيانات باقتراح Bae‏ عمليات 
(سَيْر dae‏ أو مقاربات بسيطة خطوة بخطوة)؛ لزيادة فرص النجاح في LAS‏ مشاريع التنقيب 
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في البيانات. وقد cool‏ هذه الجهود إلى العديد من العمليات القياسيةء وف هذا القسم سنذكر 
وَضْف بعضها Sae)‏ قليلٌ من أكثر هذه العمليات شيوعًا). 

وقد تمّ اقتراحٌ إحدى هذه العمليات Bats‏ التي يكن اعتبارها الأكثر شيوعًاء وهي عملية 
قياسيةٌ عبر صناعة التنقيب في البيانات (CRISP-DM)‏ في منتصف التسعينيات من قبل الاتحاد 
الأوروبي للشركات للعمل كمنهجية غير مسجّلة الملكية للتنقيب في البيانات CRISP-DM,)‏ 
esos (2013‏ الشكل 7-6 هذه العملية المقترحة. وهي سلسلة من ست خطوات a‏ بِقَهْم 
جِيد للأعمال والحاجة إلى مشروع التنقيب في البيانات sil)‏ مجال التطبيق)» وتنتهي بنشر الحل 
الذي يلبّي المتطلبات aisti‏ لاحتياجات العمل. وعلى الرغم من أن هذه الخطوات متسل لد 
في الطبيعةء غير أنه Bale‏ ما يكون هناك قدرٌ كبيرٌ من التراجع. ونظرًا لأن التجربة والخبرة؛ هي 
التي تحرك التنقيب في البيانات» Gig‏ لحالة المشكلة وا معرفة/ خبرة المحلل؛ فإنه من الممكن أن 
تكون العملية برمُتها متكرّرة للغاية (على سبيل المثال: يجب على ebl‏ أن يتوقع أن يتنقل من 
خلال الخطوات عدة مرات) وتستغرق وقتاً طويلاً. Bhg‏ لأن الخطوات اللاحقة مبنية على نتائج 
الاختبارات السابقة؛ فإنه يجبٌ على المرء أن يُولي اهتمامًا Esla)‏ للخطوات السابقة؛ من أجل عدم 
وَضْع الدراسة بالكامل على مسار غير صحيح منذ البداية. 

















شكل ع-": عملية CRISP-DM‏ ذات الست خطوات للتنقيب في البيانات 
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الخطوة -١‏ فهم الأعمال: 

إن العنصرَّ الرئيس في أي دراسة للتنقيب في البيانات؛ هو معرفة ماهية الدراسة. وتبدأ 
الإجابة عن هذا السؤال eas‏ شامل للحاجة الإدارية للمعرفة الجديدة ومواصفات صريحة لهدف 
العمل فيما يتعلق بالدراسة التي سيتمٌ إجراؤها. فنحن بحاجة إلى أهداف مُحدّدة مثل: la»‏ 
هي الخصائص المشتركة للأفراد الذين فقدناهم لمنافستنا في الآونة الأخيرة؟» أو «ما هي الملامح 
النموذجية لأعوانناء وكم القيمة التي يوفرها US‏ منهم لنا؟». ثم يتم تطويرُ خطة مشروع لإيجاد 
مثل هذه المعرفة التي تِحَدَّد الأشخاص المسؤولين عن جمع البيانات» وتحليل «obl‏ والإبلاغ 
عن النتائج. وف هذه المرحلة المبكرة؛ يجب أيضًا إنشاء ميزانية لدعم الدراسة: على الأقل عند 
مستوى Jle‏ مع أرقام تقريبية. 


الخطوة -Y‏ فهم البيانات: 

class لمهمة عمل مُحدَّدة تحديدًا جيدًا.‎ ga دراسة التنقيب في البيانات مُخصّصة‎ Ò 
مهام العمل المختلفة مجموعاتٍ مختلفةً من البيانات. وبعد فهم الأعمال؛ فإن النشاط الرئيس‎ 
لعملية التنقيب في البيانات يتمثل في تحديد البيانات ذات الصَّلةَ من العديد من قواعد البيانات‎ 
Jof المتاحة. ويجبٌ النظر في بعض النقاط الأساسية في مرحلة تحديد البيانات واختيارها. ويجبٌُ‎ 
التنقيب في البيانات؛ بحيث‎ daga واضحاً وموجرًا حول وَضْف‎ Jl أن يكون‎ ues JS وقبل‎ 
يمكن تحديدٌ البيانات الأكثر صِلةً. فعلى سبيل المثال: قد يسعى مشروعٌ استخراج بيانات تجارة‎ 
يقمن بشراء الملابس الموسمية على‎ GWI التجزئة إلى تحديد سلوكيات الإنفاق للمتسؤقات الإناث‎ 
أساس التركيبة السكانيةء ومعاملات بطاقات الائتمانء والسّمات الاجتماعية والاقتصادية. علاوةٌ‎ 
البيانات (مثل: أين يتم تخزينٌ البيانات ذات‎ jalak pls فهم‎ tia على ذلك؛ يجب على المحلّل‎ 
شكل؟ وما هي عملية جَمْع البيانات - الآلي مقابل اليدوي - ومَنْ هم جامعو‎ GÍ العلاقة؟ وفي‎ 
تحديث البيانات؟) والمتغيرات (مثل: ما هي المتغيرات الأكثر ملاءمةٌ؟‎ e Epa البيانات؟ وكم‎ 
هل هناك أي متغيّرات مترادفة أو متشابهة؟ هل المتغيّرات مستقلةً بعضها عن بعض؟ هل تقف‎ 
كمصدر معلومات كامل دون تداخل أو تعارض معلومات؟).‎ 

ولفهم البيانات بشكل أفضل؛ فإنه UU‏ ما يستخدم ال محلل Áo gna‏ متنوعةٌ من التقنيات 
الإحصائية والرموميةء مثل: ملخصات إحصائية بس يطة لكل متغير (فمثلًا: للمتغيرات الرقمية 
Jas Bugia‏ كلا من ÍI‏ الأدنى أو الأقصى والوسيط والانحراف المعياري المقاييس ال محسوبة؛ في 
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حين أنه بالنسبة للمتغيرات الفئوية» فإنه يتم حسابُ جداول الشكل والتردد)» وتحليل الارتباط 
وقطاعات الانتشار» وا مدرج الإحصايء ومؤشرات الصندوق. إن التحديد الدقيق لمصادر البيانات 
واختيارها وا متغيرات الأكثر decla‏ مُكن أن تسهل على خوارزميات التنقيب في البيانات اكتشاف 
أنماط المعرفة المفيدة بسرعة. 

وتمكن أن تتنوعً مصادر البيانات؛ من أجل انتقاء البيانات. ومن الناحية التقليدية؛ OB‏ 
مصادر البيانات لتطبيقات الأعمال تش مل SS‏ مما sab‏ البيانات الدهوغرافية (مثل: JS‏ 
التعليم» عدد ال منازلء والعمر). والبيانات الاجتماعية (مثل: الهوايات» وعضوية «Sall‏ والترفيه)» 
وبيانات المعاملات (كسجل المبيعات» والائتمان إنفاق البطاقة, والشيكات المصدرة) وما إلى ذلك. 
وفي الوقت الحاضر؛ فإن مصادر البيانات تستخدم Ur]‏ مستودعات البيانات الخارجية (المفتوحة 
أو التجارية)» ووسائط الإعلام الاجتماعيةء والبيانات المُنشأة Ji‏ 

كما يكن تصنيف البيانات على أنها eaS‏ ونوعية؛ إذ يتم قياس الكمية باستخدام القيم 
الرقميةء أو البيانات الرقمية. وقد تكون منفصلةً (مثل: الأعداد الصحيحة) أو مستمرة (مثل الأرقام 
الحقيقية). وتحتوي البيانات النوعية: ds als‏ أيضًا بالبيانات الفئوية» على البيانات الاسمية 
والترتيبية. فالبيانات الاسمية لها SS‏ غير مرتبة مُحدّدة (على سبيل المثال: بيانات النوع الاجتماعي» 
التي لها قيمتان: .5553 وإناث). البيانات الترتيبية لديها bada DS‏ منتهية. على سبيل المثال: تُعَدُ 
تقييمات العملاء الائتمانية بيانات ترتيبية؛ لأن التقييمات يمكن أن تكون ممتازة وعادلة كما هكن 
أن تكون سيئةً. وقد وَرَدَ في الفصل Y‏ تصنيفٌ بسيط للبيانات (أيْ: طبيعة البيانات). 

وجمكن Jazz‏ البيانات الكمية بسهولة عن طريق نوع من توزيع الاحتمالات؛ إذ يَصف ZIS‏ 
الاحتمالات كيف يتم تشتيت البيانات وتشكيلها. فعلى سبيل Bale. JEL‏ ما تكون البيانات 
المورّعة متماثلة ويُشار إليها Sole‏ على أنها منحنى على شكل جرس. كما OSÉ‏ تشفيرُ البيانات 
النوعية إلى أرقام» ثم gàd‏ من خلال توزيعات التردد. وبمجرد اختيار البيانات ذات الصلة وفقاً 
لهدف الأعمال التجارية للتنقيب في البيانات» يجب متابعة معالجة البيانات. 


الخطوة "- إعداد البيانات: 

ol‏ الغرض من إعداد البيانات (والذي (alles‏ عليه Éole‏ اسم المعالجة الأولية للبيانات) هو 
A‏ البيانات المحَدّدة في الخطوة السابقة وإعدادها للتحليل بواسطة طرق التنقيب في البيانات. 
ومقارنةً بالخطوات الأخرى في :CRISP-DM‏ فإن المعالجة ài; Ll‏ للبيانات تستهلك معظم 
الوقت والجهد؛ ويعتقد الكثيرون أنَّ هذه الخطوة تمثل ما يقرب من <۸٠‏ من إجمالي الوقت 
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الذي يقضيه في مشروع التنقيب في البيانات. والسبب في هذا الجهد الهائل الذي يتم إنفاقه على 
هذه الخطوة هو حقيقة أن بيانات العالم الحقيقي غير مكتملة بشكل عام (أيْ: تفتقر إلى قيم 
السّماتء أو تفتقر إلى سمات مُعيّنة للاهتمام» أو تحتوي على بيانات مُجِمّعة فقط) أو صاخبة 
sl)‏ تحتوي على أخطاء أو أخطاء خارجية) وغير متناسقة (أيْ: تحتوي على تناقضات في الرموز 
أو الأسماء). وقد ورد شرح طبيعة البيانات والمسائل المتعلّقة بعمليات المعالجة المُسبّقة لبيانات 
التحليلات بالتفصيل في الفصل الثاني. 
الخطوة 6- elu‏ النماذج: 

وفي هذه الخطوة يتم اختيارٌ تقنيات النمذجة المختلفة وتطبيقها على مجموعة بيانات Qj‏ 
lolas]‏ بالفعل لتلبية احتياجات العمل المحَدَّدة. وتشتمل خطوة cly‏ النموذج أيضًا على التقييم 
والتحليل المقارن لمختلف النماذج المبنية. ونظرًا لعدم وجود طريقة أو خوارزمية أفضل معروف 
lle‏ لمهمة التنقيب في البيانات؛ فإنه يجبٌ على المستخدم استخدامٌ مجموعة متنوعة من أنواع 
النماذج القابلة للتطبيق جنباً إلى جنب مع إستراتيجية تقييم وتجربة مُحدّدة تحديدًا جيدًا 
لتحديد الطريقة «الأفضل» لغرض معين. وحتى بالنسبة لطريقة واحدة أو خوارزمية واحدة؛ 
فإنه يجب Jaos‏ عدد من المعلمات للحصول على أفضل النتائج. وقد تحتوي بعص الأساليب 
على متطلبات مُحدّدة في الطريقة التي يتم بها تنسيق البيانات؛ وبالتالي؛ فإن العودة إلى خطوة 
إعداد البيانات تكون ضرورية في كثير من الأحيان. وتقدّم الحالة العملية 6-6 دراسة بحثيةٌ &x‏ 
lga‏ تطوير sue‏ من أنواع النماذج ومقارنتها بعضها ببعض. 

وتبعًا لاحتياجات العمل؛ OSE «B‏ أن تكون مهمة التنقيب في البيانات للتنبؤ (إما التصنيف 
أو الانحدار) أو اقتران أو نوع تجميع. كما يكن JSI‏ من هذه المهام التنقيب في البيانات من 
خلال استخدام مجموعة متنوعة من الخوارزميات وأساليب التنقيب في البيانات. وقد تناولنا 
شرح بعض طرق التنقيب في البيانات في جزء سابق من هذا «adl‏ وسوف نتناول لاحقًا في هذا 
الفصل وَصْف بعض أكثر الخوارزميات استخدامًاء ها في ذلك شجرات القرار للتصنيف» k-meanss‏ 
لتجمع الحلولء وخوارزمية Apriori‏ لاستخراج قواعد الارتباط. 


الخطوة 0- الاختبار والتقييم: 
في هذه الخطوة؛ يتم تحديدٌ وتقييمُ النماذج المتقدّمة من حيث دقتها وجدارتها؛ òl‏ تقوم هذه 
الخطوة بتقييم الدرجة التي يُلبّي بها النموذج sl)‏ النماذج) 83521 أهداف العملء وإذا كان الأمرٌ 
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كذلك؛ cl dis‏ مدى (أَيْ: هل هناك olo‏ إلى تطوير المزيد من النماذج وتقييمها؟). duas‏ خيارٌ 
آخرء وهو اختبارٌ النموذج (أو النماذج) المتقدّم في سيناريوهات العام الحقيقي في حالة ما إذا كانت 
قيود الوقت والميزانية تسمح. وعلى الرغم من أنه من المتوقع أن ترتبط نتائج النماذج المتقدّمة 
بأهداف العمل الأصلية؛ SIS‏ النتائج الأخرى التي لا ترتبط بالضرورة بأهداف العمل الأصليةء قد 
تكشف النقاب عن معلومات إضافية أو تلميحات للاتجاهات المستقبلية التي يتم اكتشافها. 


i xis‏ خطوة الاختبار والتقييم Ao yo å aga‏ وصعبةٌ؛ إذ يتم إضافة GÍ‏ قيمة بواسطة مهمة 
التنقيب في البيانات؛ حتى يتم التعرف على قيمة الأعمال التي تمّ الحصولٌ عليها من أنماط المعرفة 
المكتش فة والتعرف عليها. فتحديد القيمة التجارية من أنماط امعرفة المكتشفة يشبه إلى áb‏ ما 
لعب الألغاز. وأنماط المعرفة المستخلصة؛ هي tol‏ من اللغز والتي Cana‏ أن يتم تجميعها في سياق 
غرض العمل المحَدّد. ويعتمد نجاح عملية تحديد الهوية على التفاعل بين مُحللي البيانات girs‏ 
الأعمال وصانعي القرار (مثل مديري الأعمال). ونظرًا لأن io‏ البيانات قد لا يكون لديهم الفهم 
الكامل لأهداف التنقيب ف البيانات وما يعنيه لرجال الأعمال Less‏ الأعمالء كما أن صانعي 
القرار قد لا يكون لديهم المعرفة التقنية لتفسير نتائج الحلول الرياضية المعقدة؛ ولذلك فإن التفاعل 
بينهم Sal‏ ضروري. ولتفسير أنماط المعرفة بشكل صحيح؛ غالبًا ما يكون من الضروري استخدام 
مجموعة متنوعة من تقنيات الجدولة والتصور (على سبيل المثال: الجداول ds gahl‏ الجدولة 
المتقاطعة للنتائج؛ المخططات الدائرية» المدرج التكراريء مخططات الأرضء نقاط التشتت). 


الخطوة 5- النّشر: 

إن تطويرٌ وتقييمَ النماذج ليس نهاية مشروع التنقيب في البيانات. وحتى إن كان الغرض من هذا 
النموذج هو الحصول على استكشاف بسيط للبيانات؛ فإن المعرفة dais‏ من مثل هذا الاستكشاف 
ستحتاج إلى تنظيم وتقدهها بطريقة تجعل المستخدم النهائي قادرا على فهمها والاستفادة منها. Flog‏ 
على المتطلبات؛ فإن مرحلة النشر قد تكون das a‏ مثل إنشاء تقرير أو معقدة مثل تنفيذ عملية 
التنقيب ف البيانات القابلة للتكرار عبر ا مؤسسة. وف العديد من الحالات؟ يكون العميل» وليس 
مُحلّل البيانات» هو الذي Ai:‏ خطوات النشر. ومع ذلك فحتى إذا م يقم Jiki‏ بتنفيذ جهد النشر؛ 
فمن امهم أن يفهم العميلٌ في البداية ما هي الإجراءات التي يتعَيّن القيام بها لاستخدام النماذج التي 
تم إنشاؤها Éles‏ وقد تتضمّن خطوة النشر أيضًا أنشطة الصيانة للنماذج التي تم نشرها. نظرًا 
لأن JS‏ ثيءٍ يتعلق بالأعمال يتغير باستمرار؛ فإن البيانات التي تعكسٌ أنشطة الأعمال تتغير أيضّاء 
وبمرور الوقت؛ قد تصبح النماذج (والأنماط المضمّنة (lao‏ المبنية على البيانات القدهة Ass‏ أو غير 
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ذات صلة أو مضللة. ولذلك فمن ال مهم مراقبة النماذج وصيانته ا إذا أصبحت نتائج التنقيب في 
البيانات جزءًا من الأعمال اليومية وبيئتها. ويساعد الإعدادٌ الدقيق لإستراتيجية الصيانة على تجنّب 
فترات طويلة غير ضرورية من الاستخدام غير الصحيح لنتائج التنقيب في البيانات. ومراقبة نشر 
نتيجة (نتائج) التنقيب في البيانات» يحتاج المشروع إلى خطة مُفضَّلةَ حول عملية ASLA‏ والتي قد 
لا تكون daga‏ بسيطةً بالنسبة لنماذج التنقيب في البيانات المعقدة. 


حالة عملية €-£ 
يساعد التنقيب في البيانات في أبحاث السرطان 

وفقاً لجمعية السرطان الأمريكية؛ فإن نصف الرجال وثلث النساء في الولايات 
المتحدة الأمريكية سيصابون بالسرطان خلال حياتهم؛ ومن المتوقع أن يتم 
تشخيص ۱,١‏ مليون حالة سرطان جديدة في عام Axis pY- Y‏ السرطان هو QU‏ 
أكثر أسباب الوفاة شيوعًا في الولايات المتحدة elly‏ ولا يتجاوزه سوى أمراض 
القلب والأوعية الدموية فقط. ومن المتوقع في هذا العام أن يموت أكثر من 
٠‏ أمريكي بسبب السرطان - وهذا يعني أكثر من ١٠١‏ شخص في اليوم - 
وهو ما هثل حالة وفاة واحدة من JS‏ أربع حالات. 

والسرطان هو مجموعةً من الأمراض يتم #مثيلها بشكلٍ عام عن طريق النمو 
غير المنضبط وانتشار الخلايا غير الطبيعية. وإذا لم يتم التحكّم في النمو و/ أو 
الانتشار؛ فقد يؤدي ذلك إلى الوفاة. على الرغم من عدم معرفة الأسباب الدقيقة, 
ومن المُعتقد أن السرطان IL‏ عن عوامل خارجية (مثل: qal‏ والكائنات المعدية, 
والكيميائيةء والإشعاعية) والعوامل الداخلية (مثل: الطفرات الوراثيةء والهرمونات 
والظروف المناعية والطفرات التي تحدث بسبب التمثيل الغذائي). وقد تعمل 
هذه العوامل السّببية Ua‏ أو في تسلسل لبَدْء أو تعزيز التسرطن. ويتم التعامل 
مع السرطان بالجراحة» والإشعاع» والعلاج الكيمياي» والعلاج بالهرمونات, والعلاج 
البيولوجيء والعلاج الموجّه. وتختلف إحصاءات البقاء على قيد الحياة بشكلٍ كبيرٍ 
حسب نوع السرطان ومرحلة التشخيص. 

ol‏ معدّل البقاء على قيد الحياة Bal‏ ه سنوات لجميع السرطانات IT‏ في 
التحسّنء كما أن معدل وفيات السرطان قد انخفض إلى ۲۰ في عام W‏ ام 
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وهو ما أذَّى إلى oia‏ حوالي VY‏ مليون حالة وفاة بسبب السرطان منذ 
عام ١1۹۹م.‏ ويعني هذا أن JST‏ من 6٠١‏ شخص يتم إنقاذهم يوميًا! ويعكس 
o. ax‏ الذي طرأ على عدد الأشخاص الذين يتم إنقاذهم مدى التقدّم في 
تشخيص بعض أنواع السرطان في مرحلة مبكرة والتحسينات في العلاج. غير أننا 
ما زلنا بحاجة إلى مزيدٍ من التحسينات لمنع وعلاج السرطان. 





وعاى الرّغم من أن أبحاث السرطان كانت ذات طابع سريريّ وبيولوجي في 
العادة؛ فإن الدراسات التحليلية المستندة إلى البيانات أصبحت GS‏ شائعًا في 
السنوات الأخيرة. وقد RI‏ تحديدٌ اتجاهات البحوث الجديدة في المجالات الطبية؛ 
إذ تمّ تطبيق الأبحاث التي تعتمدُ على البيانات والتحليلات بنجاح» وذلك من 
أجل تعزيز الدراسات السريرية والبيولوجية. وقد تمن الباحثون من تحديد 
أنماط جديدة باستخدام أنواع مختلفة من البيانات» ها في ذلك البيانات التجريبية 
d a y pads dL a sedi‏ والمرتكزة على الأدبيات (الكتابات التي كتبت في هذا 
(g iatl‏ ومعلومات التجارب الشّريرية» إلى جانب أدوات وتقنيات التنقيب في 
البيانات المناسبة» وقد GSE‏ الباحثون من تحديد أنماط جديدة؛ مما مد الطريق 
نحو pee‏ خالٍ من السرطان. 

às‏ إحدى الدراسات استخدم )2009( Delen‏ ثلاث تقنيات شائعة للتنقيب 
في البيانات؛ وهي: (أشجار القرارء والشبكات العصبية الاصطناعية» وآلة المتجهات 
الداعمة) بالتزامن مع الانحدار اللوجستي (المنطقي) لتطوير نماذج pall‏ للقدرة 
على البقاء مع وجود سرطان البروستاتا. وقد تضمّنَت مجموعة البيانات حوالي 
۲٠۰۰۰‏ سجل و۷۷ متغيرا. كما تم استخدام منهجية التحقق المتقاطع س - جزء 
(K-fold)‏ في بناء النماذج والتقييم والمقارنة. وقد أوضحت gbl‏ أن نماذج 
المتجهات الداعمة؛ هي الأكثر دقة ga)‏ دقة ضبط تبلغ Y,A0‏ 43( لهذا ا مجال 
تليها الشبكات العصبية الاصطناعية وأشجار القرار. وعلاوةٌ على ذلك؛ وباستخدام 
طريقة تقييم تعتمد على الحساسية - التحليليةء كشفت الدراسة Ul‏ عن أنماط 
جديدة تتعلق بالعوامل التي تُنذر بوجود سرطان البروستاا. 

وفي دراسة ذات صلة استخدم فيها ds‏ من Walker g Delen‏ و(2005) «Kadam‏ 
اثنين من خوارزميات استخراج البيانات» وهي: (الشبكات العصبية الاصطناعية, 
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وأشجار القرار) والانحدار اللوجستي (المنطقي) لتطوير نماذج التنبؤ لبقاء سرطان 
الثدي باستخدام مجموعة كبيرة من البيانات (أكثر من ۲٠٠,٠٠١‏ حالة). وباستخدام 
منهجية التحقق المتقاطع المكوّنة من ٠١‏ أجزاء لقياس التقدير غير المتحيّز لنماذج 
التنبؤ لأغراض مقارنة الأداء - أشارت النتائجُ إلى أن شجرة القرارات (خوارزمية (C5‏ 
كانت أفضل طريقة تنبق مع d$»‏ 95,7 على العينة المخالفة (والتي كانت أفضل 
طريقة تنبؤ كرت في الأدبيات) تليها الشبكات العصبية الصناعية مع دقة 
۲ والانحدار اللوجستي (منطقي) مع دقة 49.7/. وقد كش ف المزيدٌ من 
التحليل لنماذج التنبؤ عن أهمية تنبؤات العواملء والتي يمكن استخدامها بعد 
ذلك كأساس لزيد من الدراسات البحثية السريرية والبيولوجية. 

Zadeh و(2015)‎ Deleng .Zolbanin من‎ Js الدراسة الأخيرة؛ قام‎ às 
بدراسة تأثير الاعتلال ا مشترك في البقاء على قَيْد الحياة للسرطان. وعلى الرغم من‎ 
أن الأبحاث السابقة أظهرت أن التوصيات التش خيصية والعلاجية يمكن أن تتغير‎ 
djs على شدة الأمراض المصاحبة» غير أن الأمراض المزمنة لا تزال قيد البحث‎ to 
بعضها عن بعض في معظم الحالات. ولتوضيح أهمية الأمراض المزمنة المتزامنة‎ 
الأوبئة» والنتائج النهائية‎ oleg في أثناء العلاج؛ فقد استخدمت دراستهم المراقبةء‎ 
لإنشاء مجموعتين من البيانات الرضية: إحداهما لسرطانات الثدي‎ (SEER) 
والأخرى لسرطانات البروستاتا والسرطانات البولية.‎ SLN والأعضاء التناسلية‎ 
الآلة الشائعة على مجموعات البيانات‎ olas ثم يتم تطبيق العديد من تقنيات‎ 
الناتجة لبناء نماذج تنبؤية (انظر: شكل 6-6). وقد أظهرت مقارنة النتائج أن‎ 
أن يحسّن‎ oS الحصول على مزيد من المعلومات حول الحالات المرضية للمرضى‎ 
من القدرة التنموية لدى النماذجء والتي بدورها هكن أن تساعد الممارسين على‎ 
اتخاذ قرارات أفضل في التشخيص والعلاج. ولذلك؛ فقد اقترحت الدراسة أن‎ 
التحديد السليم وتسجيل واستخدام حالة الاعتلال المشترك للمرضى يمكن أن يقلل‎ 
تكاليف العلاج ويخفف من التحَدّيات الاقتصادية المتعلقة بالرعاية الصحية.‎ 
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jas‏ هذه الأمثلة (ضمن العديد من الدراسات الأخرى في الأدبيات الطبية) أنه 
يكن استخدام تقنيات دقيقة للبيانات المتقدّمة لتطوير نماذج تمتلك ios‏ عاليةٌ 
من القدرة التنبؤية والتفسيرية. وعلى الرغم من أن أساليب التنقيب في البيانات 
job‏ على استخراج DLII‏ والعلاقات المخبّأة في أعماق قواعد البيانات الطبية 
الكبيرة والمعقّدة دون التعاون والتغذية المرتدة من الخبراء الطبيين؛ فإن نتائجها 
ليست مفيدةً بشكل كبير؛ إذ يجبٌ تقبيم DLI‏ الموجودة عبر أساليب التنقيب 
في البيانات من قبل المتخصّصين في المجال الطبي الذين لديهم سنوات من الخبرة 
في مجال المشكلة؛ لتحديد ما إذا كانت منطقية db,‏ للتطبيق ومبتكرةً ا يكفي 
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لتبرير اتجاهات بحثية جديدة. وباختصار؛ فإنه لا uaa:‏ من التنقيب في البيانات 
أن تحلّ محل المهنيين والباحثين المتوسطين؛ بل تجمع جهودهم التي لا تُقدّر 
بثمن لتوفير اتجاهات بحثية جديدة مدفوعة بالبيانات ولإنقاذ المزيد من الأرواح 
البشرية في نهاية المطاف. 

أسئلة للمناقشة: 

-١‏ كيف OSE‏ استخدامٌ التنقيب في البيانات لعلاج الأمراض في نهاية المطاف 
مثل السرطان؟ 

-Y‏ ما هي في اعتقادك الوعود coL adsis‏ الكبرى التي يواجهها العاملون في 
مجال التنقيب في البيانات للمساهمة في الجهود البحثية الطبية والبيولوجية؟ 
Sources: Zolbanin, H. M., Delen, D., & Zadeh, A. H. (2015). Predicting overall‏ 
survivability in comorbidity of cancers: A data mining approach. Decision Support‏ 
Systems, 74, 150161-; Delen, D. (2009). Analysis of cancer data: A data mining‏ 
approach. Expert Systems, 26(1), 100112-; Thongkam, J., Xu, G., Zhang, Y., & Huang,‏ 
E (2009). Toward breast cancer survivability prediction models through improving‏ 
training space. Expert Systems with Applications, 36(10), 1220012209-; Delen, D.,‏ 


Walker, G., & Kadam, A. (2005). Predicting breast cancer survivability: A comparison 
of three data mining methods. Artificial Intelligence in Medicine, 34(2), 113127-. 


عمليات ومنهجيات أخرى مُوخَّدة للتنقيب في البيانات: 

s‏ يتمّ تطبيقها بنجاح؛ فإنه يجبٌ النظر إلى دراسة التنقيب في البيانات على أنها عملية تتبع 
منهجية واحدة بدلا من مجموعة من أدوات وتقنيات البرامج الآلية. فإضافةً إلى :CRISP-DM‏ 
هناك منهجيةٌ أخرى معروفة تمّ تطويرها من قبل معهد SEMMA (2009) LÀ Lá, SAS‏ إذ 
do‏ اختصار SEMMA‏ إلى «العينة» والاستكشاف, والتعديل» والطرازء والتقييم». 

وبدءًا من عيّنة من البيانات G3‏ تمثيلها إحصائيًا؛ dazu SEMMA Ó‏ من السهل تطبيق 
الأساليب الاستكشافية الإحصائية والتصويرء وتحديد وتحويل eal‏ المتغيّرات التنبؤية» وتهيئة 
المتغيّرات SU‏ بالنتائج» وتأكيد do‏ النموذج. وهناك تمثيلٌ مُصوّر ل SEMMA‏ في الشكل 0-6. 
ومن خلال تقييم نتائج JS‏ مرحلة من مراحل عملية SEMMA‏ هكن shb‏ النموذج تحديد 
كيفية صياغة أسئلة جديدة تثيرها النتائج السابقة. وبالتاليء العودة إلى مرحلة الاستكشاف 
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من أجل تحسين البيانات بشكل أفضل؛ وذلك كما هو الحال مع .CRISP-DM‏ إذ يتم تشغيلٌ 
SEMMA‏ بدورة تجريبية متكررة للغاية. ويتمثل الفرق الرئيس بين SEMMA s CRISP-DM‏ 
في أن CRISP-DM‏ يتخذ منهجًا أكثر doa à‏ - ا في ذلك فهم الأعمال والبيانات ذات الصّلةَ 
- بالقياس بمشروعات التنقيب في البيانات» في حين يفترض SEMMA‏ ضمنيًا أن أهداف وغايات 
مشروع التنقيب في البيانات تكون la‏ جنبًا إلى جنب مع تحديد مصادر البيانات المناسبة وفهمها. 





Sample Xy 
توليد عينة تمثيلية للبيانات‎ 





SEMMA 














شكل €-0: عملية SEMMA‏ للتنقيب في البيانات 

(KDD) ما يستخدم بعض الممارسين مصطلح اكتشاف المعرفة في قواعد البيانات‎ Soles 
وآخرون (1997) اكتشاف المعرفة في قواعد‎ Fayyad كمرادف للتنقيب في البيانات. وقد عرّف‎ 
البيانات بأنها عمليةٌ لاستخدام أساليب التنقيب في البيانات؛ للعثور على معلومات وأنماط مفيدة‎ 
في البيانات» على عكس تعدين البيانات» والتي تنطوي على استخدام الخوارزميات لتحديد الأنماط‎ 
هي عملية‎ KDD حيث إِنَّ‎ (I-t (انظر: الشكل‎ KDD في البيانات المشتقة؛ من خلال عملية‎ 
من بيانات تنظيمية: كما‎ KDD شاملةٌ تشمل التنقيب في البيانات» ويتكون الإدخال إلى عملية‎ 
بكفاءة؛ لأنه يوفر مصدرًا واحدًا للبيانات التي يتم‎ KDD يتيح مستودع بيانات للمؤسسة تنفيذ‎ 
على أنها تتكوّن من الخطوات التالية:‎ KDD عملية‎ Dunham (2003) استخراجها. وقد لخَّص‎ 
اختيار البيانات» معالجة البيانات» تحويل البيانات» التنقيب في البيانات» التفسير/ التقييم.‎ 
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شكل 5-6: KDD das‏ (اكتشاف المعرفة في قواعد البيانات) 


ويوضّح الشكل 6-/ نتائج الاستطلاع للسؤالء «ما هي المنهجية الرئيسة التي تستخدمها في 
التنقيب في البيانات؟» (تم الاستطلاع عن kdnuggets.com (3; Jb‏ في أغسطس ۲۰۰۷). 


























Source: Used With Permission From Kdnuggets.com 


شكل 6-/: رتب منهجيات/ عمليات التنقيب في البيانات 
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gll الفصل‎ 


أسئلة للمراجعة على قسم it-t‏ 

-١‏ ما هي عمليات التنقيب في البيانات الرئيسة؟ 

OT Miss ISU -Y‏ المراحل الأولى (فهم العمل وفهم البيانات) هي الأطول في مشاريع التنقيب في البيانات؟ 

-Y‏ اذكر مراحل عملية «CRISP-DM‏ وعرّفها بإيجاز. 

-E‏ ما هي الخطواتٌ الرئيسة معالجة البيانات؟ قم بِوَضْف كل خطوة بإيجان مع تقديم أمثلة 
ذات صلة. 

0- ما هو الفرق بين SSEMMA s .CRISP-DM‏ 


0-4 طرق التنقيب فى البيانات: 

asl ss‏ من الطرق المتنوعة لأداء دراسات التنقيب في البيانات» والتي تشمل: التصنيف» 
والانحدارء والتجميع, والترابط. وتستخدم glano‏ أدوات برامج التنقيب في البيانات أكثر من تقنية 
(خوارزمية) لكل من هذه الطرق. وفي هذا القسم نقدّم os‏ لأساليب التنقيب في البيانات الأكثر 
شيوعًا مع شرح التقنيات التي تقوم بتمثيلها. 


التصنيف: 

رها تكون طريقة التصنيف للتنقيب في البيانات؛ هي الطريقة الأكثر استخدامًا لمشكلات 
العام الحقيقي. وبصفتها عضوًا مشهورًا في عائلة تقنيات العام الآلي؛ ole‏ التصنيف يتعلم Éli‏ 
من البيانات السابقة (مجموعة من المعلومات - السّمات والمتغيّرات والميزات - على العناصر أو 
الكائنات أو الأحداث المسماة سابقًا) لوضع حالات جديدة ga)‏ بطاقات تعريف غير معروفة) في 
مجموعاتهم أو فصولهم. فعلى سبيل المثال: GS‏ استخدام التصنيف للتنبؤ Le‏ إذا كان الطقس 
في يوم معين سيكون «مشمسًا» أو «ممطرّاه أو «Ue»‏ وتتضمّن مهام التصنيف الشائعة الموافقة 
على الائتمان (أيْ: المخاطر الانتمانية الجيدة أو السيئة)ء وموقع المتجر (أيْ: هل الموقع جيد أو 
معتدل» أو سيئ؟) والتسويق المُسِتَهدّف (على سبيل JE‏ العميل Jaah‏ أو الذي لا Jal‏ 
منه)» وكشف الاحتيال ssl)‏ نعم/ لا)» والاتصالات السّلكية واللاسلكية (بمعنى أنه من المحتمل أن 
يتحول إلى شركة هاتف أخرىء نعم/ لا). فإذا كان المتوقع هو تسمية فئة (مثل: «مشمس» أو 
«ممطر» أو «غائم»)؛ فإن مشكلة التنبؤ CAS‏ تصنيفاً؛ في حين إذا كانت قيمة رقمية (على سبيل 
المثال: درجة الحرارة مثل: TA‏ درجة (F‏ فإن مشكلة التنبو تُسمّى انحداراً. 


v"‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


وعلى el‏ من أنه يكن Clas ad‏ التجميع (وهي طريقة أخرى شائعةً للتنقيب في البيانات)؛ 
لتحديد المجموعات (أو عضوية (CAII‏ للأشياء؛ فهناك فرق كبيرٌ بين الاثنين؛ إذ يتعرّف التصنيف على 
الوظيفة بين خصائص الأشياء (أيْ: المتغيّرات المستقلة) وعضويتها ina s)‏ ا مخرجات) من خلال عملية 
elsi‏ تحت الإشراف؛ إذ يتم تقديمٌ كلا النوعين (المدخلات وا مخرجات) من المتغيرات إلى خوارزمية؛ Ul‏ 
في التجميع؛ فإن iss‏ عضوية الكائنات يتم من خلال عملية elus‏ غير خاضعة للإشراف؛ إذ يتم عرض 
منغ oli‏ الإدخال فقط على الخوارزمية. وعلى عكس التصنيف؛ فإن التجميع ليس له T‏ إشرافيةٌ 
(أو مراقبة) تفرض عملية «elu‏ وبدلا من ذلك؛ فإن الخوارزميات الخاصة بالتجميع تستخدم Vr‏ 
أو أكثر من الاستدلالات (مثل: قياس المسافة مُتعدّد الأبعاد) لاكتشاف التجمعات الطبيعية للأجسام. 
وجديِرٌ بالذكر أنَّ منهجية الخطوتين الأكثر شيوعًا للتنبؤ بنوع التصنيف تتضمّن تطويراً/ 
تدريباً نموذجياً واختباراً / نشراً نموذجياً. وفي مرحلة تطوير النموذج؛ ي يتم استخدامٌ مجموعة من 
بيانات الإدخالء بما في ذلك ملصقات الفئات الفعلية. وبعد أن يتم تدريبُ النموذج يتم اختبار 
gògail‏ مقابل عينة الحجز لتقييم 5.0« وفي النهاية يتم نشره للاستخدام الفعلي؛ إذ يتم Sl‏ 
coL tà‏ مثيلات البيانات الجديدة (إذ يكون تصنيف الفئة غير معروف). وعند تقييم النموذج؛ 
إن هناك عدة عوامل لا 3$ من أخذها في الاعتبارء odas‏ الآني: 
- الدّقة التنبؤية: هي قدرة النموذج على التنبؤ بشكل صحيح بتصنيف الفئة للبيانات الجديدة أو 
غير المرئية مسبقاً. ودقة التنبؤ هي عامل التقييم SUI‏ استخدامًا لنماذج التصنيف. ولحساب 
هذا المقياس؛ فإنه يتم مطابقة تصنيفات الطبقة الفعلية لمجموعة بيانات اختبار مع تصنيفات 
الفئات التي يتنبأ بها النموذج. وبعد ذلك GLE‏ احتسابٌُ الدقة كمعدل دقةء وهي النسبة 
المئوية لعيّنات مجموعة بيانات الاختبار التي تم تصنيفها بشكلٍ صحيح بواسطة النموذج 
(وسوف Joli‏ هذا الموضوع بشيءٍ من التفصيل لاحقًا في الفصل). 

- السرعة: هي التكاليف الحسابية التي ينطوي عليها توليدٌ واستخدام النموذجء وكلما كان ذلك 
أسرع؛ فإنه ix‏ أفضل. 

- المتانة: هي 8,95 gògail‏ على إجراء تنبؤات دقيقة إلى is‏ 4 معقول عندما e‏ م إعطاؤه بيانات 


صاخبة (غير دقيقة) أو بيانات ذات قيم مفقودة أو خطأ. 
- قابلية التوشّع: هي القدرة على ely‏ نموذج التنبؤ بكفاءة تعطى كميةً كبيرةً من البيانات. 
- التفسير: هو مستوى الفهم والبصيرة اللذان يوفرهما النموذج (مثل: كيف أو ما يختتمه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري nw‏ 


gll الفصل‎ 


تقدير الدّقة الحقيقية لنماذج التصنيف: 

La في مشكلات التصنيف؛ هو مصفوفة الدّقة (وتُسمّى‎ ABI المصدرٌ الأماسي لتقدير‎ dad 
طمشكلة تصنيف من‎ BII مصفوفة‎ ۸-٤ الشكل‎ ggg مصفوفة التصنيف أو جدول الطوارئ).‎ 
فئتين؛ إذ نمثل الأرقام على طول القطر من اليسار العلوي إلى اليمين السفلي القرارات الصحيحة‎ 


والأرقام خارج هذا القطر تمثل الأخطاء. 

















شكل :A-€‏ مصفوفة Confusion‏ بسيطة لجدولة نتائج تصنيف فئتين 
ويقدّم الجدول ١-6‏ معادلات مقاييس الدقة الشائعة لنماذج التصنيف. 


جدول 1-6: مقاييس الدّقة الشائعة لنماذج التصنيف 





الوصف 


القياس 








نسبة الحالات JS ia dall‏ صحيح (إيجابيات 
وسلبيات) مقسومةً على إجمالي عدد الحالات. 


(TP4TN/TP) + (TN+FPFN) = الدّقة‎ 





(a.k.a. Sensitivity)‏ نسبة الإيجابيات Aa al‏ بشكلٍ 
صحيح dos aio‏ على إجمالي العدد الموجب (أيْ: معدل 
الضرب أو الاسترجاع) 


معدل موجب حقيقي = TP/ (TP--EN)‏ 





(a.k.a. Specificity)‏ نسبة السلبيات المصنّفة بشكلٍ 
صحيح مقسومة على العدد الإجمالي السلبي G)‏ معدل 
الإنذار الخطأ) 








معدل سالب حقيقي = TN/ (TN+FP)‏ 








ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


FA 


التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 














القياس الوصف 
نسبة الإيجابيات المصئّفة بشكلٍ صحيح مقسومةً على 
الإحكام = (TP/TP)4FP‏ مجموع الإيجابيات المصئّفة بشكلٍ صحيح والإيجابيات 
التي i‏ تصنيفها بشكلي غير صحيح 
نسبة الإيجابيات المصنّفة بشكلٍ صحيح مقسومةٌ على 
الاستدعاء = (TP/TP)«EN‏ مجموع الإيجابيات المصنّفة بشكل صحيح والسّلبيات 








وعندما لا 9953 مشكلة التصنيف ÁSL‏ تزداد مصفوفة الارتباك (مصفوفة مربعة بحجم العدد 
الفريد لعناوين (OLU‏ وتُصبح مقاييس الدَّقة Saloh‏ بمعدلات دقة الفئة ودقة التصنيف الإجمالية. 





(True Classification) 
(True Classification Rate); — 


DI APERUIT TREE 
g (False Classification) 
-1 


n 
a (True Classification), 
(Overall Classifier Accuracy); = il 


Total Number of Cases 





َد تقديرٌ دقة نموذج تصنيف (Cà aa sl)‏ الناجم عن eis‏ الخوارزمية تحت الإشراف 
Tal‏ مهما لسببين: أولًا: هكن استخدامه لتقدير مدى دقة التنبؤ المستقبلية» والتي قد تشير إلى 
مستوى الثقة الذي يجبٌ أن يكون لدى المرء في مخرجات المصنف في نظام التنبؤ. Gbg‏ هكن 
استخدامه لاختيار مصنف من بين مجموعة مصنّفات (تحديد ةوذج التصنيف «الأفضل» بين 
مجموعة مُدرّبة).و فيما يلي بعض منهجيات التقدير الأكثر شيوعًا الممستخدّمة لنماذج التنقيب في 
البيانات بطريقة التصنيف. 





الانقسام البسيط: يُقسّم الانقسام البسيط (أو إجراء تقييم أو اختبار للعيّنة) البيانات إلى 
مجموعتين فرعيتين حصريتين متبادلتين وتُعرفان بمجموعة التدريب ومجموعة الاختبار (أو 
مجموعة التمرير)» ومن الشائع des‏ ثلثي البيانات كمجموعة تدريب من قبل المحفُز (مُنشئ 
النموذج) ومن ثم يتم اختبار qal iial‏ على مجموعة الاختبار. ويحدث استثناءٌ لهذه 
القاعدة عندما يكون المصنف عبارة عن شبكة عصبية اصطناعية. وفي هذه الحالة؛ يتم تقسيم 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ya‏ 


الفصل الرابع 


البيانات إلى ثلاث مجموعات فرعية استثنائية: التدريبء والتحقق من الصحةء والاختبار. كما 
يتم استخدام مجموعة التحقق من الصحة في أثناء بناء النموذج لمنع التثبيت. ويوضح الشكل 
9-6 منهجية الانقسام البسيط. 




















شكل 5-6: تقسيم البيانات العشوائية البسيطة 

ويتمثل SAI‏ الأساسي لهذه الطريقة في افتراض أن OLLI‏ في المجموعتين الفرعيتين هي من 
نفس النوع sl)‏ لها نفس الخصائص بالضبط). ونظرًا لأن هذا التقسيم عشوائي بسيط؛ فقد لا 
يكون هذا الافتراض صحيحًا. ولتحسين هذا الوَضْع؛ فإنه يتم اقتراح أخذ العيّنات الطبقية؛ إذ 
تصبح الطبقات هي متغيرٌ ا مخرجات» deg‏ الرغم من o]‏ هذا o isi‏ على الانقسام البسيط 
غير أنه لا يزال لديه تحير مرتبط بالتجزئة العشوائية المفردة. 

التحقق باستخدام س - أجزاء edo ass :(K-flod)‏ هذه المنهجية لتقليل التحيّز المرتبط 
با معاينة العشوائية لعيّنات بيانات التدريب والعزل في مقارنة الدقة التنبؤية لطريقتين أو أكثر. 
ds‏ هذه المنهجية. والتي يُطلق عليها LA‏ تقدير الدوران» يتم تقسيم مجموعة البيانات الكاملة 
بشكل عشوائي إلى مجموعات فرعية حصرية متبادلة متساوية الحجم تقريبًا؛ إذ يتم تدريب 
نموذج التصنيف واختباره عدد (س) من المرات. وفي JS‏ مرة يتم تدريبه على جميع أجزائه؛ ولكن 
مرة واحدة ثم يتم اختبارها على الجزء المنفرد المتبقي. ويتمٌ حساب تقدير هذه المنهجية من 
الدقة الكلية للنموذج ببساطة بمتوسط مقاييس الدقة الفرديةء كما هو مُوضّح في المعادلة التالية: 











ka : 











rV.‏ ذكاء الأعمال والتحليلات وعلم BLII‏ منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


CVA ^a 5]‏ إلى دقة التحقق المتقاطع» و(س) هو عدد الأجزاء المُستخدّمة, و(4) هو مقياس 
الدّقة (أيْ: Asa‏ الضربء والحساسية: والخصوصية) JS)‏ جزء. يعرض الشكل aa ٠١-6‏ بيانيًا 
للتصديق المتقاطع 1-1014 إذ تمّ تعيين س على .٠١‏ 




















شكل :٠١-6‏ تصوير بياني لاختبار الصلاحية المتقاطع من عدد K‏ من الطبقات 
منهجيات إضافية لتقييم التصنيف وتتضمّن منهجيات التقييم الشائعة الأخرى ما يلي: 
- الإبقاء على واحد :Leave-one-out‏ وهذه الطريقة تشبه Sia‏ المتقاطع من K-fold‏ إذ 
تأخذ K‏ قيمة ١؛‏ بمعنى أنه يتم استخدام JS‏ نقطة بيانات للاختبار مرة واحدة على العديد من 
النماذج المتقدّمة؛ إذ Sae ahg‏ من نقاط البيانات. وهذه الطريقة مُستَهلكة للوقت؛ غير أنها 
في بعض الأحيان iS‏ خيارًا قابلًا للتطبيق بالنسبة لمجموعات البيانات الصغيرة. 
:Bootstrapping -‏ ومع هذه الطريقة يتم أخذ عينات عدد cob‏ من النماذج من البيانات 





الأصلية ga)‏ الاستبدال) للتدريبء وتُسِتَخدّم بقية مجموعة البيانات للاختبار. ويتم تكرارٌ هذه 
العملية عدة مرات حسب الرغبة. 

:Jackknifing -‏ وعلى الرغم من تشابه هذه الطريقة مع منهجية Leave-one-out‏ مع احتساب 
التحصيل؛ فإنه يتم حساب الدقة من خلال ترك عينة واحدة عند S‏ تكرار لعملية التقدير. 

- المنطقة تحت منحنى ROC‏ إن المنطقة تحت منحنى ROC‏ هي تقنية تقييم رسومية؛ إذ 
يتم تخطيط ال معدل الإيجابي الحقيقي على المحور Y‏ ويم 25 e‏ المعدل الإيجابي الخاص على 
المحور .X‏ وتحدد المنطقة الواقعة تحت منحنى ROC‏ مقياس دقة المصنف؛ إذ تشيرٌ القيمة 
Y‏ إلى المصنف اللمثالي» في حين ٠,١ Í‏ لا تشير إلى أكثر من المصادفة العشوائية؛ وفي الواقع؛ فإن 
القيم تتراوح بين الحالتين المتطرفتين. فمثلًا في الشكل A-E‏ يحتوي A‏ على slol‏ تصنيف أفضل 
من B‏ حين أن C‏ لا يكون أفضل من الفرصة العشوائية كرمي العملة. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري لفقا 


الفصل الرابع 
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المعدل الإيجابي الخاطيء (1-الخصوصية ) 











شكل :١١-6‏ منحنى ROC äus‏ 
تقنيات التصنيف تستخدم عدداً من التقنيات (أو الخوارزميات)؛ لنمذجة التصنيفء ومنها: 

- تحليل شجرة القرار: OS‏ القول بأن تحليل شجرة القرار (تقنية تعلّم (SI‏ هو أكثر تقنيات 
التصنيف شيوعًا في مجال التنقيب في البيانات. وسيرد وَضْفٌ daas‏ لهذه التقنية في القسم 
dl‏ من هذا الفصل. 

- تحليل sila]‏ كانت التقنيات الإحصائية عبارة عن الخوارزميات التصنيفية الأساسية: لعدّة 
سنوات؛ حتى ظهرت تقنيات ecu‏ الآلة. o is‏ تقنيات التصنيف الإحصاف الانحدار 
اللوجيستي والتحليل المميِّزء وكلاهما من الافتراضات التي تفيد بأن العلاقات بين المتغيرات 
المدخلة والمخرجات تكون بطبيعتها lao‏ والبيانات موزّعة بشكلٍ طبيعيء والمتغيرات ليست 
مترابطةٌ ومستقلةً بعضها عن بعض. وقد أَدّت الطبيعة ا مشكوك فيها لهذه الافتراضات إلى 
التحوّل نحو تقنيات olas‏ الآلة. 

- الشبكات العصبية: olas‏ التقنية هي الأكثر شيوعًا من بين تقنيات IYI eds‏ والتي يكن 
استخدامها لمشكلات نموذج التصنيف. 


yvy‏ ذكاء الأعمال والتحليلات pleg‏ البيانات» منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


- الاستدلال المبني على حالة: يستخدم هذا الهج حالاتٍ تاريخية؛ للتعرّف على القواسم المشتركة 
لتعيين حالة جديدة في الفئة الأكثر احتمالا. 

oa-‏ البيزية :Bayesian classifiers‏ يستخدم هذا Tal‏ نظرية الاحتمال لبناء نماذج تصنيف 
تستندٌ إلى الأحداث السابقة القادرة على وضع مثيلٍ جديدٍ في فئة (أو سلسلة) أكثر احتمالا. 

- الخوارزميات الجينية: Laig‏ بها استخدامٌ تشابه التطور الطبيعي لبناء آليات مستندة إلى 
البحث لتصنيف otie‏ البيانات. : 

- المجموعات الخام: هذه الطريقة تأخذ بعين الاعتبار العضوية الجزئية لعلامات الفئات لفئات 
La Bade‏ في نماذج البناء (تجميع القواعد) ممشكلات التصنيف. 

والحقيقة أنَّ الوصف الكامل لجميع تقنيات التصنيف خارج نطاق هذا الكتاب؛ وبالتالي فإننا 
سوف نتناول هنا العديد من التقنيات الأكثر انتشارًا فقط. 


مجموعة نماذج لأفضل التحليلات التنبؤية: 

Ó|‏ عملية إنشاء مجموعات هي في جوهرها عمليةٌ ذكية لجمع المعلومات (التوقعات أو 
التنبؤات) التي 3( إنشاؤها وتوفيرها من قبل اثنين أو أكثر من مصادر المعلومات ssl)‏ نماذج 8( 
وعلى الرغم من وجود Jam‏ مستمرٍ حول مستوى تطؤر أساليب المجموعة المستخدّمة؛ O‏ 
هناك إجماعاً Gle‏ على أن نماذج المجموعات تُنتج معلوماتٍ أكثر 658 وموثوقيةٌ لقرارات العمل 
(Seni & Elder, 2010)‏ أي gozdi ól‏ بين التنبؤات OL‏ أن (وغالبًا (l‏ يؤدي إلى تحسين الدقة 
وقوة نتائج ا معلومات» مع الحَذَّ من الشك والتحيّز ا مرتبطين بالنماذج الفردية. 

وكما نعلم جميعًا أنه لا يوجد في نماذج التنقيب في البيانات والتنبؤ بها نموذجٌ ais JUS‏ أنه 
«أفضل نموذج» مقبول lle‏ يناسب (sl‏ مشكلة؛ إذ يعتمدٌ أفضل نموذج على السيناريو الذي 
يجري تحليله ومجموعة البيانات المُستخدّمة؛ وهذا النموذج Y‏ يكن الحصول عليه إلا من خلال 
التجربة والخطأ على نطاق واسع (وهذا لا يحدث إلا في حالة توافر الوقت واموارد). ومثلما 
لا يُوجَد نموذج واحد يمكن أن يُوصف بأنه الأفضل؟ فإنه لا يُوجَّد Ul‏ أفضل تنفيذ منفرد لأنواع 
النماذج المختلفة؛ فمثلًا أشجار القرار والشبكات العصبية وآلة المتجهات الداعمة لها أساليب 
بناء ومجموعات من العوامل المتغيّرة تحتاجُ إلى «تحسين» أفضل النتائج الممكنة. ويقوم علماء 
البيانات بتطوير طرق جديدة لتحسين دقة وكفاءة نماذج التنبؤات في الوقت الحالي. وتتمثل 
إحدى الطرق المؤكدة للقيام بذلك في دمج مخرجات نماذج التنبؤ في نتيجة مركبة als‏ وهي 
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مجموعة نموذجية. dads‏ الفرق التي تستخدم مجموعة نماذج (Ensemble)‏ - الفرق التي فازت 
بالعديد من منافسات التنقيب في البيانات والتنبؤ بالبيانات في السنوات الأخيرة - هي الفرق 
الفائزة (وللحصول على 468 بمسابقات التحليلات والفرص التحليلية الحديثة انظر: kaggle.org‏ 

(Abbott 2014, P. 307) تصنيف نماذج المجموعات إلى متجانسة أو غير متجانسة‎ OSZI 
من‎ JS] الاسم؛ فإن مجموعات النماذج المتجانسة تجمع بين نتائج نموذجين أو‎ cesi وكما‎ 
تطوير أغلب مجموعات النماذج‎ OLS أشجار القرار. وفي الواقع؛‎ Jia نفس النوع من النماذج»‎ 
فئتا التعبئة والتعزيز الفئتين‎ ss المتجانسة يتم باستخدام مزيج من هياكل شجرة القرار.‎ 
والذي حقق‎ S ا معترف به بشكل‎ JUL الشائعتين من مجموعات شجرة القرار. ويُطلق على‎ 
Random Forest نجاحًا كبيرًا في مجموعات شجرة القرار من نوع مجموعات الغابة العشوائية‎ 
كغابة من العديد من‎ Random Forest بدلا من بناء شجرة كبيرة؛ إذ تتطوّر الغابة العشوائية‎ - 
(وهو اسم قصير‎ AdaBoosting الأشجار الصغيرة. وخير مثالٍ لدعم مجموعات شجرة القرار هو‎ 
الأهمية أو المساهمة)‎ ssl) ل «التعزيز التكيّفي») - وهو الخوارزمية التي تعمل على تغيير الوزن‎ 
والذي يستند إلى نتائج التصنيف غير‎ «elu المخصص لكل عينة بيانات في كل تكرار في عملية‎ 
الصحيح؛ بحيث يتح تحسينٌ دقة المصنف / المتنبئ لجميع تصنيفات الفصل.‎ 

Ul‏ مجموعات النماذج غير المتجانسة؛ فإنها - كما يوحي اسمها - تجمع بين نوعين مختلفين أو 
أكثر من النماذج مثل: أشجار القرارء والشبكات العصبية الاصطناعيةء والانحدار اللوجستي» وآلة 
المتجهات الداعمة. والجدير بالذكر أن استخدام النماذج التي تختلف جوهريًا بعضها عن بعض 
As)‏ أحد عوامل النجاح الرئيسة في نمذجة المجموعات؛ إذ تتناول البيانات من منظور مختلف. 
ونظرًا لأن الطريقة التي تجمع بين نتائج نماذج مختلفة لأنواع مختلفة من النماذج؛ فإن ا مجموعة 
النموذجية غير المتجانسة A a‏ أيضًا نماذج الدَّمج is Sharda, 20105 Delen) (lsslsll‏ 
عملية دَمْج نتائج نماذج متعددة. سواء أكانت تصويتاً بسيطاً JS)‏ نموذج يُسهم بالقدر نفسه 
صوت واحد) أو مزيج تركيبي من التصويت US qaad)‏ نموذج tla‏ على دقة التنبؤ به - النماذج 
الأكثر .432 لها قيمة وزن (del‏ ممكن استخدامه. وبغض النظر عن طريقة التوليفة؛ فقد نت 
أن المجموعات تمثل dL]‏ لا 2335 بثمن GY‏ مشروع للتنقيب في البيانات والنمذجة التنبؤية. 
وعلى الرغم من أنَّ النمذجة 835xll‏ تعمل على تحسين الدقة والقوة, غير أن لها جانباً Ls‏ إذ 
إنها Lái So‏ من تعقيد النموذج» ومن ثم عدم القدرة على تفسيرها Gİ)‏ الشفافية). ويُوضْح 
الشكل 17-6 رسمًا بيانيًا لمجموعة نموذج غير متجانس. 
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شكل :۱۲-٤‏ توضيح بياني مجموعة غير متجانسة 

وقبل أن نوصح تفاصيل أشجار القرار؛ فإننا نحتاجُ إلى مناقشة بعض المصطلحات البسيطة. 
Jais Tof‏ أشجار القرار العديد من متغيرات المدخلات التي قد يكون لها تأثيرٌ على تصنيف 
الأنماط المختلفة. وعادةً ما GA Lud‏ هذه المتغيرات UE‏ بالسّمات. فمثلًا إذا أردنا بناء نموذج 
لتصنيف مخاطر القروض على أساس اثنين فقط من الخصائص - الدخل والتصنيف الائتماني - فإ 
هاتين الخاصيتين سستكونان هما الصفات. والمخرجات الناتجة ستكون هي الفئة (والتي قد تكون 
منخفضةً أو متوسطة أو عالية المخاطر). ثانياً: تتكون الشجرة من مجموعة من الفروع والعقد. 
ويمثل الفرع نتيجة اختبار لتصنيف نمط (على أساس اختبار) باستخدام إحدى السّمات. وتمثل 
عقدة الورقة في النهاية اختيار الفصل النهائي hail‏ (سلسلة من الفروع من عقدة الجذر إلى 
عقدة الورقةء والتي هكن تمثيلها كإشارة if-then‏ معقدة). 

وتكمن الفكرة الأساسية وراء شجرة القرار في أنها تقسّم بشكل متكرّر مجموعة التدريب 
حتى يتكون كل قسم بشكلٍ JalS‏ أو بشكلٍ أسامي من أمثلة من فصل واحد. 59 تحتوي JS‏ عقدة 
غير ورقية من الشجرة de‏ نقطة انقسام وهي عبارة عن اختبار لواحد أو E‏ من السمات 
وتُحدّد كيفية تقسيم البيانات بشكلٍ أكبر. وبشكل fele J‏ فإن الخوارزميات الخاصة بشجرة à‏ القرار 
eb‏ بإنشاء شجرة مبدئية من بياناتٌ التدريب؛ بحيت c‏ تكون às‏ عقدة ô‏ عبارة عن أوراق نقية, ثم 

تقوم بتقليم الشجرة لزيادة تعميمهاء وبالتالي دقة 5l‏ على بيانات الاختبار. 
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وفي مرحلة النمؤ؛ يتم بناء الشجرة عن طريق تقسيم البيانات بشكلٍ مُتكرّر حتى تصبح كل 
وحدة نقية (أيْ: تحتوي على أعضاء من نفس الفئة) أو صغيرة نسبيًا. وفكرتها الأماسية تعتمد 
على طرح الأسئلة والتي تقوم الإجابات عنها بتوفير معظم المعلومات. على غرار ما قد نفعله إذا 
لعبنا لعبة «عشرون «ig‏ 

ويعتمد الانقسامٌ المستخدم لتقسيم البيانات على نوع السّمة المُستَخدّمة في التقسيم. وبالنسبة 
إلى السّمة المستمرة A‏ تكون التقسيمات من قيمة النموذج (A) > X‏ إذ تمثل X‏ قيمة الانقسام 
«المثلى» LA‏ فعلى سبيل JEL‏ هكن أن يكون التقسيم المبني على الدخل هو «الدخل 0٠٠٠١‏ >». 
وبالنسبة للسّمة الفئوية tA‏ فإن الانقسامات التي هي من قيمة النموذج (A)‏ تنتمي إلى (X‏ حيث X‏ 
هي مجموعة فرعية من 4. فمٹلا يمكن أن يكون الانقسام على mE‏ الجنس: «ذكر مقابل أنثى». 

xa الخوارزمية العامة لبناء شجرة القرار؛ فهي كما‎ GÍ 
إنشاء عقدة جذرية وتعيين جميع بيانات التدريب إليها.‎ -١ 
تحديد أفضل سمة تجزئة.‎ -Y 
قيمة من الانقسام؛ بحيث يتم تقسيم البيانات إلى مجموعات‎ SI إضافة فرع إلى عقدة الجذر‎ -Y 

فرعية متبادلة (nonoverlapping)‏ على طول خطوط التقسيم المحدّد والانتقال إلى الفروع. 
£- تكرير الخطوتين Y‏ و" JS)‏ عقدة موجودة في JS‏ ورقة حتى الوصول إلى معايير التوقف (فمثلا 

يتم التحكم في العقدة بتسمية فئة واحدة). 

وقد تم اقتراحٌ العديد من الخوارزميات المختلفة لإنشاء أشجار القرار. وتختلف هذه 
الخوارزميات بشكل أساسي من حيث الطريقة التي تُحدّد بها خاصية التجزئة (وقيمها 
المقسومة). وترتيب تقسيم السمات (تقسيم نفس السمة مرة واحدة فقط أو عدة مرات)» وعدد 
الانقسامات عند JS‏ عقدة (ثنائي مقابل ثلاني)» ومعايير التوقفء وتقليم الشجرة la)‏ قبل الحرق 
.(postpruning‏ ومن أكثر الخوارزميات شهرة نظام 1103 (متبوعة ب 04.5 C59‏ كنسخ معدلة 
من (ID3‏ من تعلم الآلةء والتصنيفء بالإضافة إلى أشجار الانحدار (CART)‏ من الإحصائيات, 
وكاشف التفاعل الأوتوماتيي مربع كاي chi-squared (CHAID)‏ من التعرّف على الأنماط. 

وعند إنشاء شجرة قرار؛ يكون الهدف في (S‏ عقدة هو تحديدٌ السّمة ونقطة الانقسام لهذه 
السمة التي تقسّم سجلات التدريب على أفضل وجه لتنقية تمثيل الفئة في تلك العقدة. ولتقييم 
سلامة الانقسام؛ فقد تم اقتراح بعض مؤشرات التقسيم. وقد der‏ أن أكثر مؤشرين شيوعًا هما 
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مؤشر جيني Gini index‏ وكسب المعلومات tinformation gain‏ حيث يُستَخدّم مؤشر جيني 
Gini index‏ في خوارزميات CART‏ 581812719 (قابلة للتحجيم بالتعقب الذاتي للأشجار). كما 
يتم استخدام إصدارات من كسب المعلومات في 123 (والإصدارات الأحدث, 04.5 و05). 

وقد استخدم مؤشر جيني Gini index‏ في الاقتصاد لقياس تنوع السكان. كما هكن استخدام 
نفس المفهوم لتحديد درجة نقاء فئة معينة كنتيجة لقرار التفرّع على طول سمة أو متغير معين. 
وأفضل انقسام هو الذي يزيد من نقاء المجموعات الناتجة عن الانقسام المقترح. وفيما يلي 
نتناول بإيجاز حساباً بسيطاً لمؤشر جيني. 

إذا كانت مجموعة البيانات S‏ تحتوي على أمثلة من فئات n‏ فسيتمٌ تعريف مؤشر جيني 
Gini index‏ على أنه 





ginkS) = l-ap} 








حيث Pj‏ هو تردد نسبي للفئة زفي 5. فإذا كانت مجموعة البيانات 5 مقسمة إلى مجموعتين 
فرعیتین» 51 S29‏ بأحجام 1 N29‏ على التوالي؛ óp‏ مؤشر جيني Gini index‏ للبيانات المقسّمة 
يحتوي على أمثلة من فئات a‏ ويتم تعريف مؤشر جيني Gini index‏ على أنه 





N 5 N, 


ginisidS) = "egin(S) ^. giniS;) 





حيث يتم اختيار مجموعة السمة / الانقسام التي توفر أصغر sginisplit (S)‏ من أجل تقسيم 
العقدة. وفي مثل هذا الشأن؛ فإنه يجب سرد جميع نقاط التقسيم ال ممكنة JSI‏ صفة. 


zat 


Ul‏ كشب المعلومات؛ فهو آلية التقسيم ID3 43 ll‏ والتي رها تكون الخوارزمية 
الأكثر شهرةٌ وا معروفة باسم شجرة القرار. وقد $3 تطويرها من قبل Ross Quinlan‏ في «e MA‏ 
ومنذ ذلك الحين؛ فقد قام بتطوير هذه الخوارزمية ضمن الخوارزميات 04.5 -C53‏ وتكمن 
الفكرة الأماسية ل ID3‏ (ومتغيراتها) في استخدام مفهوم GA ud‏ الإنتروبيا Jas entropy‏ من 
مؤشر جيني ‘Gini index‏ حيث يقيس الانتروبيا مقدار الشك أو العشوائية في مجموعة البيانات. 
فإذا كانت جميع البيانات في مجموعة فرعية تنتمي إلى فئة واحدة فقط؛ فلا يُوجَد أي شك أو 
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عشوائية في هذه المجموعة من البيانات» وبالتالي؛ فإن الإنتروبيا entropy‏ صفر. والهدف من هذا 
النهج؛ هو clis‏ الأشجار الفرعية بحيث تكون الإنتروبيا entropy‏ لكل شجرة فرعية نهائية صفر 
(أو قريبة من الصفر). وفيما يلي نتناول أيضًا حساب كسب المعلومات. 

وعلى افتراض أنَّ هناك فنتينء P‏ (موجبة) وه (سالبة). دع مجموعة الأمثلة S‏ 
تحتوي على عدد p‏ من فئة P‏ وعدد n‏ من الفئة N‏ فإن كمية المعلومات المطلوبة 
لتحديد ما إذا كان ا مشال التعسّفي في S‏ ينتمي إلى P‏ أو N‏ يتم تعريفها على أنها 


p 
Kp, n) = - log, p n we, n 


ptn ptn ptn ptn 

















وبفرض استخدام السمة A‏ فإنه سيتم تقسيم المجموعة 5 إلى مجموعات 4S1, 52, ..., Sv]‏ 
فإذا احتوى Si‏ على أمثلة pi‏ من P‏ وأمثلة ni‏ من N‏ فإن الإنتروبيا entropy‏ أو المعلومات 
المتوقعة اللازمة لتصنيف الكائنات في كل الأشجار الفرعيةء Si‏ هي 





E(A) = APi * ipn) 
iP +n 











ومن $85 فإن ال معلومات التي سيتم اكتسابها من خلال g il‏ على السّمة A‏ ستكون 
-Gain (A) = E (p.n) - E (A)‏ 

حيث يتم تكرار هذه الحسابات Sd‏ سمةء كما يتم تحديدٌ تلك التي لها كسب المعلومات 
العالي كسمة التجزئة. وتتشابه الأفكار الأساسية وراء مؤشرات التقسيم هذه بعضها مع بعض» 
غير أن تفاصيل الخوارزمية adol‏ تختلف. وهكن العثورٌ على تعريف تفصيلي لخوارزمية 123 
وآلية تقسيمها في )1986( -Quinlan‏ 

وتوضّح الحالة العملية 0-6 مدى أهمية المكاسب المتحضّل عليها إذا 83 استخدام تقنيات 
التنقيب في البيانات الصحيحة لمشكلة عمل مُحدَّدة بشكل جيد. 
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حالة عملية ٥-٤‏ 
تستخدم شركة Influence Health‏ التحليلات التنبؤية المتقدّمة للتركيز على العوامل 
التي تؤثر É>‏ في قرارات الرّعاية الصحية الخاصة بالأشخاص 

ei i‏ شركة Influence Health‏ منصة تفاعل وتفعيل المستهلك الرقمي الوحيد في 
قطاع الرعاية الصحية؛ حيث 554 منصة Influence Health‏ مقدّمي الخدمة وأصحاب 
العمل والدافعين من التأثير إيجابًا على a Lo‏ القرار والسلوكيات الصحية للمستهلك 
Le‏ يتجاوز alae]‏ الرعاية البدنية من خلال المشاركة المتعددة الشخصية والتفاعلية. 
وقد ساعدت الشركة منذ عام ١۱۹۹م‏ - ومقرها في برمنغهام بولاية ألاباما - أكثر من ١١٠١‏ 
منظمة مزوّدة في التأثير على المستهلكين بطريقة تحؤلية لتوفير التكاليف بالإضافة إلى الجودة. 

إن الرعاية الصحية هي jas‏ شخصي؛ إذ تختلف احتياجات S‏ مريض وتتطلب 
استجابة فرديةء ومن ناحية أخرى - فإنه مع استمرار ارتفاع تكاليف توفير خدمات 
الرعاية الصحية- تحتاج المستشفيات والنظم الصحية بشكل متزايد إلى الاستفادة من 
وفورات الحجم من خلال توفير الطعام لأكبر 245 من السكان؛ إذ يصبح gibal‏ عندئذ 
هو توفير نهج شخصي في أثناء العمل على نطاق واسع. كما تتخمّص شركة Influence‏ 
Health‏ في مساعدة عملاء قطاع الرعاية الصحية على j>‏ هذا gial‏ من خلال 
التعرّف على مرضاهم الحاليين والمحتملين بشكل أفضل واستهداف JS‏ فرد بالخدمات 
الصحية المناسبة في الوقت المناسب. وتسمح تقنية التحليلات التنبؤية المتقدّمة من 
IBM‏ لشركة Influence Health‏ بمساعدة عملائها على اكتشاف العوامل التي لها أكبر 
تأثير على قرارات dole JI‏ الصحية للمرضى. ومن خلال تقييم ميل مثات ag‏ من 
العملاء المتوقعين للحصول على خدمات رعاية صحية خاصة؛ فإن Influence Health‏ 
bjo‏ على زيادة الإيرادات ومعدلات الاستجابة لحملات الرعاية الصحيةء وتحسين 
النتائج لعملائها ومرضاهم على حَدٌ سواء. 

استهداف المستهلك الذكي: 

أصبحت صناعة الرعاية الصحية اليوم أكثر تنافسية من أي وقتٍ مضى؛ إذ Ól‏ انخفاض 
استخدام خدمات المنظمة؛ يؤدي إلى انخفاض أرباحها til‏ إذ هيل المستهلكون الآن 
إلى اختيار أفضل dole JI padia‏ الصحيةء بدلا من مجرد البحث عن أقرب مستشفى 
أو Ske‏ وبالتوازي مع الجهود المشتركة في الصناعات الأخرى؛ فإنه يجب على منظمات 
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الرعاية الصحية بذل المزيد من الجهد لتسويق نفسها بشكلٍ JS Jks‏ من المرضى 
الحالبين وا محتملين وبناء التواصل والولاء على المدى الطويل. 

إن مفاتيح النجاح في تسويق الرعاية الصحية؛ هي التوقيت المناسب والأهمية. 
فإذا كنت تستطيع التنبؤ بنوع الخدمات الصحية التي قد يحتاجها الفرد المحتمل؛ فإنه 


يمكنك المشاركة والتأثيرٌ عليه بشكل أكثر فاعلية في العناية بالصحة. 

Venky Ravirala zó ri‏ رئيس قسم التحليلات في شركة Influence Health‏ أن: 
«مؤسسات الرّعاية الصحية تخاطر بفقدان انتباه الأشخاص l5]‏ أوصلوا إليهم رسائل 
غير ذات صلة. ونحن نساعد عملاءنا على تجنب هذا الخطر من خلال استخدام التحليلات 
لتقسيم آفاقهم الحالية وا محتملة والسوق لهم بطريقة شخصية وملائمة أكثر بكثير». 

تحليلات أسرع وأكثر مرونة: 

ومع uel m as‏ عملائها؛ ازداد الحجم الإجمالي للبيانات في أنظمة التحليلات في 
Influence Health‏ ليشمل أكثر من ۱۹١‏ مليون سجل للمرضىء مع سجل تفصيلي للمرض 
s‏ 63 ملايين من المرضى. وقد علق Ravirala‏ على ذلك بقوله: go»‏ وجود الكثير من 
البيانات للتحليل؛ أصبحت طريقة تسجيل البيانات الحالية لدينا معقدةً للغاية وتستغرق 
وقتاً طويلاً. ولذلك فقد أردنا أن نكون قادرين على استخراج الأفكار بسرعة أكبر ودقة أكبر». 

ومن خلال الاستفادة من برمجيات التحليلات التنبؤية من TBM‏ أصبحت 
Influence Health‏ الآن قادرة على تطوير Tòl‏ تحسب مدى احتمالية أن يحتاج 
JS‏ مريض إلى خدمات معينة fino‏ عن هذا الاحتمال كنسبة مئوية. ويعتمد التقسيم 
djal‏ والعديد من النماذج الخاصة بالأمراض على البيانات الدهوغرافية والاجتماعية 
والاقتصادية والجغرافية والسلوكية وتاريخ الأمراض وبيانات التعداد وبحث الجوانب 
المختلفة لاحتياجات ds‏ مريض من الرعاية الصحية المتوقعة. 


ويضيف Ravirala‏ قائلًا: «ويتيح IM Í W‏ الجمع بين JS‏ هذه النماذج 
باستخدام تقنية المجموعة؛ مما يساعد على dicil‏ على قيود النماذج الفردية وتقديم 
نتائج أكثر دقةٌ؛ فهي تمنحنا ا مرونة لتطبيق تقنيات متعددة iod‏ مشكلة ما والتوصّل 
إلى أفضل JL‏ لها. كما أنها تعمل على تنفيذ الكثير من عمليات التحليلات تلقائيًا؛ 
مما مُكّننا من الاستجابة لطلبات العملاء بشكلٍ أسرع من ذي قبل وكثيرًا ما نوفر لهم 
مستوى أعمق من البصيرة فيما يتعلق بالقطاع المرضى». 
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فعلى سبيل المثال: قرّرت Influence Health‏ اكتشاف كيفية انتشار المرض وتنوع 
الخطر بين مجموعات مختلفة داخل عامة السكان. وذلك باستخدام تقنيات تحليل مجموعة 
معقدة للغاية, تمكن الفريق من اكتشاف أمراض الاعتلال المشتركة الجديدة التي تعمل على 
تحسين القدرة على التنبؤ بالمخاطر لأكثر من ٠٠١‏ مرض شائع بنسبة تصل إلى XN‏ 

وهذا يساعد على التفريق بثقة تامة بين المرضى ذوي المخاطر العالية والمعرضين 
لمخاطر عالية للغاية؛ مما يسهّل استهداف الحملات على المرضى والمحترفين الذين هم 
Qual à‏ الحاجة إليها. ومع وجود مثل هذه الأفكار في متناول اليد؛ فإن Influence‏ 
Health‏ قادرةٌ على استخدام خبرتها في تسويق الرعاية الصحية لتقديم المشورة لعملائها 
حول أفضل dadl‏ لتخصيص موارد التسويق. 

وقد أردف Ravirala‏ قائلًا: «يقوم عملاؤنا بعمل ضوابط كبيرة للميزانية على أساس 
التوجيهات التي نقدمها لهم». «ونحن نساعدهم على زيادة تأثير حملات öh‏ واحدة - 
مثل حملات سوق التأمين الصحي عند بدء Obamacare‏ - بالإضافة إلى خططهم 
الإستراتيجية الطويلة المدى والاتصالات التسويقية المستمرة». 

الوصول إلى الجمهور اممناسب: 

يساعد تأثيرٌ شركة Influence Health‏ على زيادة الإيرادات وتحسين الصحة 
السكانية؛ من خلال تمكين عملائها من استهداف أنشصطتهم التسويقية بشكل AS]‏ 
فعاليةً. 5535 sRavirala e‏ «وبفضل العمل معنا؛ SG‏ العملاء من تحقيق عائد 
استثماري يصل إلى VW‏ من خلال التسويق cat ld‏ بشكل أفضلء لا يتعلق الأمر 
فقط بالإيرادات: فمن خلال ضمان إرسال معلومات الرعاية الصحية الحيوية إلى 
الأشخاص الذين يحتاجون dad!‏ نحن نساعد bedas‏ على تحسين مستويات الصحة 
العامة في ا مجتمعات التي تخدمهم». 

وتستمرٌ Influence Health‏ في صقل تقنيات النمذجة. واكتساب فهم أعمق 
للسمات الحرجة التي تؤثر على قرارات الرعاية الصحية. فمع مجموعة أدوات تحليل 
مرنة في متناول يدها؛ فإن الشركة jga‏ بشكل جيد للحفاظ على تحسين خدماتها 
للعملاء. ويذكر Ravirala‏ أنه: «في المستقبل؛ نر يد أن نتعرف على بيانات المريض 
والبيانات المرتقبة إلى المستوى JEI‏ ونحدد أنماط السلوك وندمج التحليل مع مكتبات 
تعلم الآلة. لقد أعطتنا IBM SPSS‏ بالفعل القدرة على تطبيق ودمج العديد من 
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الموديلات دون LLS‏ خط واحد من التعليمات البرمجية. ونحن حريصون على الاستفادة 
من IBM de‏ مع توسيع نطاق تحليلات الرّعاية الصحية لدينا لدعم النتائج السريرية 
وخدمات إدارة صحة السكان». 

ويختتم Venky Ravirala‏ رئيس قسم التحليلات في Influence Health‏ قائلًا: 
«نحن نحقق تحليلات على نطاق غير مسبوق. فاليوم؛ يمكننا تحليل VAO‏ مليون سجل 
مع YO‏ نموذج مختلف في أقل من es?‏ وهي ago‏ لم تكن ممكنة لنا في الماضي». 

أسئلة للمناقشة: 

TInfluence Health ماذا فعلت‎ -١ 

-Y‏ ما هي التحديات والحلول المقترحة والنتائج التي تم الحصول عليها؟ 

-Y‏ كيف هكن أن يساعد التنقيب في البيانات الشركات في صناعة الرعاية الصحية 
(بطرق أخرى غير المذكورة في هذه الحالة)؟ 
Source: Influence Health: Focusing on the factors that really influence people's‏ 


healthcare decisions. IBM Case Study, www.presidion.com/case-study-influence-health. 


التحليل التجميعي للتنقيب في البيانات: 

dd‏ التحليل التجميعي طريقةٌ أساسيةٌ للتنقيب في البيانات لتصنيف العناصر أو الأحداث أو 
المفاهيم إلى مجموعات مشتركة تُسمّى مجموعات. وتُستخدّم هذه الطريقة بشكلٍ شائع في ele‏ 
الأحياءء والطب» وعلم الوراثةء وتحليل الشبكات الاجتماعية» وعلم الإنسان, وعلم JYI‏ بالإضافة 
إلى علم الفلك والتعرّف على المفاهيم» وحتى في نظم إدارة ا معلومات (MIS)‏ ونظرًا لزيادة 
انتشار التنقيب في البيانات؛ فقد تمّ تطبيق التقنيات الأساسية على الأعمال؛ خاصة على التسويق. 
كما 3 استخدامٌ التحليل التجميعي على نطاق واسع؛ للكشف عن الاحتيال JS)‏ من الاحتيال على 
بطاقة الائتمان والتجارة الإلكترونية) وتجزئة السوق للعملاء في أنظمة CRM‏ المعاصرة. ويستمر 
تطوير المزيد من التطبيقات في الأعمال؛ ]3 يتم التعرّف على قوة تحليل المجموعات واستخدامها. 

إن التحليل التجميعي هو أداةٌ لتحليل البيانات الاستكشافية لحل مشكلات التصنيف. ويهدف 
إلى تصنيف الحالات (مثل: الأشخاص. والأشياء والأحداث) إلى مجموعات أو مجموعات؛ بحيث 
تكون درجة الارتباط قويةٌ بين أعضاء نفس المجموعة وضعيفة بين أعضاء المجموعات المختلفة. 
وتصف كل مجموعة الفئة التي ينتمي إليها أعضاؤها. ومن الأمثلة الواضحة في تحليل الأبعاد 
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التجميعية؛ إنشاء نطاقات درجات يكن من خلالها تعيين درجات دراسية لفئة الكلية. وهذا 
يشبه مشكلة التحليل التجميعي التي واجهتها وزارة الخزانة الأمريكية عند إنشاء أقواس ضريبية 
جديدة في الثمانينيات. مثال خيالي لحدوث التجميع في كتب هاري بوتر J. K. Rowlings‏ 
Harry Potter books‏ يُحدّد Sorting Hat‏ أي بيت (مبنى) لتعيين طلاب السنة الأولى à‏ 
مدرسة هوجورتس. Jia‏ آخر ينطوي على تحديد كيفية جلوس الضيوف في حفل الزفاف. أمّا 
فيما يتعلق بمعالجة البيانات؛ فإن أهمية التحليل التجميعي هي أنها قد تكشف عن مجموعات 
وهياكل في بيانات لم تكن odla‏ من قبل ولكنها معقولة ومفيدة عندما يتم العثور عليها. 
ويمكن استخدامٌ نتائج التحليل التجميعية في: 
- تحديد نظام التصنيف (مثل: أنواع العملاء). 
- اقتراح نماذج إحصائية لوصف السكان. 
- ظهور قواعد لتعيين حالات جديدة للفصول لتحديدها واستهدافها وأغراض التشخيص. 
- توفير مقاييس التعريف والحجم والتغيير في المفاهيم السابقة. 
- البحث عن حالات نموذجية لتسمية وتمثيل الطبقات. 
- تقليل حجم وتعقيد مساحة المشكلة للطرق الأخرى للتنقيب في البيانات. 
- تحديد القيم المتطرفة في مجالٍ معين (مثل: اكتشاف الأحداث النادرة). 
تحديد العدد الأمثل للمجموعات: تتطلّب الخوارزميات التجميعية Luas ole‏ عدد المجموعات 
المطلوب العثور عليها. فإذا كان هذا الرقم غير معروف من خلال المعرفة السابقة؛ فإنه يجب 
اختياره بطريقة ما. ولسوء الحظ؛ فإنه لا ap‏ طريقة اختيارية لحساب ما يفترض أن يكون هذا 
الرقم. ولذلك فقد تم اقتراح عدة طرق إرشادية مختلفة. وفيما يلي نذكر أكثر هذه الطرق شيوعًا: 
- انظر إلى النسبة المئوية للفارق الموضَّح كدالة لعدد المجموعات؛ أيْ: اختر عددًا من المجموعات؛ 
بحيث لا يؤدي إضافة مجموعة أخرى إلى إعطاء نماذج أفضل للبيانات. وعلى وجه التحديد 
إذا تم توضيح السب المئوية للتباين في أحد الرسوم البيانية بواسطة المجموعات؛ فهناك 
نقطة سينخفض عندها الكسب الهامشي (إعطاء زاوية في الرسم البياني)؛ مما يشير إلى عدد 
ا مجموعات التي سيتمٌ اختيارها. 
- اضبط Sae‏ المجموعات على À / Y (n7 Y)‏ حيث n‏ هو عدد نقاط البيانات. 
- استخدم معيار المعلومات (AIC) Akaike‏ وهو مقياسٌ للصلاحية الملائمة (على أساس مفهوم 
الانتروبيا (entropy‏ لتحديد عدد المجموعات. 
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- استخدم معيار المعلومات Bayesian‏ وهو معيار اختيار النموذج (على ساس dl‏ الأقصى 
لتقدير الاحتمال) لتحديد عدد ال مجموعات. 

طرق التحليل: قد يعتمد تحليل المجموعات على واحد أو أكثر من الطرق العامة التالية: 
- الأساليب الإحصائية Le)‏ في ذلك التسلسل الهرمي وغير الهرمي)» مثل: k-means‏ أو -k-modes‏ 
- الشبكات العصبية ga)‏ أسلوب بناء يُسمَّى خريطة التنظيم الذاق). 
- المنطق الضبابي (مثل: خوارزمية (fuzzy C-means‏ 
- الخوارزميات الجينية. 

تعمل JS‏ طريقة من هذه الطرق بشكلٍ عام مع واحدة من فثتي الطريقة العامة: 
- انقسام: مع الفصول المقسّمةء تبدأ جميع العناصر في مجموعة واحدة وتتفكك. 
- تجميع هرمي: مع الفئات التجمعية:؛ تبدأ جميع polial‏ في مجموعات فردية» وتكون 

ا مجموعات مجمعة معًا. 

وتتضمّن معظم طرق التحليل التجميعية استخدام مقياس المسافة؛ لحساب التقارب بين أزواج 
العناصر. وتشمل مقاييس المسافة المنتشرة المسافة التقليدية (أيْ: المسافة العادية بين نقطتين 
هكن قياسها بالمسطرة) ومسافة مانهاتن iaig)‏ أيضًا المسافة المستقيمةء أو مسافة التاكسي بين 
نقطتين). وفي كثير من الأحيان تقوم على مسافات حقيقية يتخ قياسهاء ولكن هذا لا يلزم أن يكون 
كذلك» كما هو الحال ole‏ في تطوير نظم المعلومات. كما يمكن استخدامٌ المتوسطات ال مرجحة 
لتحديد هذه المسافات. فمثلًا في مشروع تطوير S‏ قد تكون الوحدات الفردية للنظام مرتبطة 
بالتشابه بين مدخلاتهاء والمخرجاتء والعمليات» والبيانات المحدّدة الممستخدّمة. ثم يتم تجميع 
هذه العواملء متزاوجةً حسب العنصي في مقياس مسافة واحدة. 

الخوارزمية التجميعية :K-means‏ يكن القول ob‏ خوارزمية K-means‏ (حيث تشير K‏ إلى 
عدد diah‏ مسبقاً من المجموعات) هو أكثر الخوارزميات التجميعية التي يُشار إليها. كما أن لها 
جذورها في التحليل الإحصائي التقليدي. وكما يوحي الاسم؛ فإن هذه الخوارزمية تقوم بتعيين كل 
alam‏ بيانات (العميل» الحدث. الكائن... إلخ) إلى المجموعة التي يكون مركزها (التي يُطلق عليها 
Las‏ النقطة الوسطى) هو الأقرب. ويتم حسابٌ المركز كمتوسط جميع النقاط في المجموعة؛ 
أي o]‏ إحداثياتها هي المتوسط الحسابي لكل بُعد بشكل dualis‏ على كل النقاط في المجموعة. 
ويوضّح الشكل ٠١-٤‏ خطوات هذا الخوارزمية والتي سنذكرها فيما يلي: 
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- خطوة التهيئة: اختر عدد ا مجموعات (أيْ: قيمة (K‏ 

- الخطوة :١‏ إنشاء نقاط عشوائية k‏ عشوائيًا كمراكز مجموعة أولية. 

- الخطوة ؟: قم بتعيين كل نقطة إلى مركز المجموعة الأقرب. 

- الخطوة :Y‏ إعادة إنشاء مراكز المجموعات الجديدة. 

- خطوة التكرار: كرر الخطوتين Y‏ و۴ حتى يتم استيفاء معيار تقارب Bs)‏ ما يصبح تعيين 
النقاط إلى المجموعات (ÉG‏ 

















شكل :W-£‏ توضيح lo‏ للخطوات في خوارزمية K-Means‏ 

التنقيب في قاعدة الترابط: 

dad‏ التنقيب في قاعدة الترابط (المعروف Ul‏ باسم تحليل التقارب أو تحليل سلة السوق) 
أسلوبًا شائعًا للتنقيب في البيانات؛ إذ يُستَخدّم ole‏ كمثال لتوضيح ما الذي يعنيه التنقيب في 
البيانات» وما يمكن أن يفعله لجمهور أقل خبرة من الناحية التقنية. وقد يكون معظمكم قد سمع 
عن العلاقة الشهيرة (أو سوء السمعة؛ فهذا يعتمد على نظرتكم إليها) التي تفصل بين مبيعات البيرة 
والحفاضات في محلات البقالة. وكما تقول القصة؛ O‏ سلسلة متاجر كبيرة Walmart Lg)‏ ورها Y‏ 
حيث لا يُوجَّد توافق في الآراء بشأن سلسلة السوق الفائقة التي كانت عليها) قامت بتحليل عادات 
الشراء لدى العملاء. ووجدت علاقة ارتباط ذات IY‏ إحصائية بين مشتريات البيرة ومشتريات 
الحفاضات. وقد وُجد أن السبب في ذلك هو أن الآباء (الذين يفترض أنهم شباب) كانوا يتوقفون في 
السوبر ماركت لشراء حفاضات لأطفالهم (خاصةً أيام الخميس) ولأنهم م بعد بإمكانهم النزول إلى 
ساحة الرياضة في كثيرٍ من الأحيانء مثلما لم يعد بإمكانهم شراء البيرة Lad‏ ونتيجةً DM‏ يزعم أن 
سلسلة المتاجر الكبرى وضعت الحفاضات بجانب البيرة؛ مما أدى إلى زيادة مبيعات كليهما. 
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ويهدف استخراج قاعدة المجموعات في جوهره إلى إيجاد علاقات مثيرة للاهتمام (الصلات) 
بين المتغيرات (البنود) في قواعد البيانات الكبيرة. وبسبب تطبيقه الناجح لمشكلات تجارة التجزئة؛ 
فإنه يُطلّق عليه Bale‏ تحليل سلة السوق. وتتمثل الفكرة الرئيسية في تحليل سلة السوق في 
تحديد العلاقات القوية بين المنتجات المختلفة (أو الخدمات) التي يتم شراؤها عادةً Ua‏ (تظهر في 
نفس السلة do‏ إما سلة مادية في متجر للبقالة أو سلة افتراضية على موقع للتجارة الإلكترونية). 
فمثلًا يشتري >1٥‏ من أولئك الذين يشترون Cas‏ شاملا للسيارات التأمين الصحي أيضًا. ANS‏ 
من أولئك الذين يشترون الكتب عبر الإنترنت يشترون الموسيقى عبر الإنترنت أيضّا؛ بالإضافة إلى 
أن 1٠‏ من أولئك الذين لديهم ارتفاعٌ في ضغط الدم وزيادة الوزن؛ لديهم ارتفاع كوليسترول في 
الدم؛ XV- g‏ من العملاء الذين يشترون حاسباً محمولاً وبرامج الحماية من الفيروسات يشترون 
أيضًا خطط خدمة مُوسّعة. 

وتتمثل المدخلات في تحليل سلة السوق في بيانات معاملات نقطة البيع البسيطة؛ إذ يتم 
تبويب عدد من المنتجات أو الخدمات التي تم شراؤها Gla) Uno‏ مثل محتوى إيصال الشراء) في 
حالة معاملة واحدة. axis‏ نتيجة التحليل بمثابة معلومات لا JA‏ بثمن والتي يمكن استخدامها 
لفهم سلوك الشراء لدى العملاء بشكلٍ أفضل لتحقيق أقصى قدرٍ من الرّبح من المعاملات التجارية؛ 
إذ تستفيد الأعمال التجارية من هذه المعرفة عبر: 
-١‏ وَضع العناصر بعضها بجانب بعض؛ لجعلها Sİ‏ ملاءمةً للعملاء لالتقاطها la‏ وعدم نسيان 

شراء واحدة عند شراء الأخرى (زيادة حجم المبيعات). 
-Y‏ الترويج للبنود كحزمة gås V)‏ واحدةٌ للبيع إذا كان الآخرون معروضين للبيع). 
-P‏ وضعها بعضها بعيدًا عن بعض؛ بحيث يكون على العميل المشي في الممرات للبحث عنه؛ وذلك 

من خلال القيام بذلك من المحتمل رؤية وشراء سلع أخرى. 

وتشتمل تطبيقات تحليل سلة السوق على التسويق المتقاطع, والبيع المتقاطع» وتصميم 
المتجرء وتصميم الكتالوج» وتصميم موقع التجارة الإلكترونية؛ بالإضافة إلى تحسين الإعلان عبر 
الإنترنت» وتسعير teil‏ فضلا عن تكوين المبيعات/ الترويج؛ إذ Ael Las‏ تحليل سلة السوق في 
جوهره الشركات على استنتاج احتياجات العملاء وتفضيلاتهم من أنماط الشراء. وخارج نطاق 
عام الأعمال؛ فإن قواعد المجموعات pisus‏ بنجاح لاكتشاف العلاقات بين الأعراض والأمراض 
والتشخيص وخصائص وعلاجات المريض (التي يمكن استخدامها في نظام دعم القرار الطبي) 
والجينات ووظائفها (التي GKE‏ استخدامها في مشاريع الجينوميات)» من بين أمورٍ أخرى. وفيما 
يلي بعض المناطق والاستخدامات الشائعة لاستخراج قاعدة المجموعات: 
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- معاملات البيع: GLE‏ استخدامٌ مجموعات من منتجات التجزئة التي تم شراؤها leo‏ لتحسين 
موضع المنتج في الطابق المخصّص للمبيعات (وضع المنتجات التي تتماثى بعضها مع بعض) 
والتسعير الترويجي للمنتجات (وليس وجود عروض ترويجية على dS‏ من المنتجات التي يتم 
شراؤها في الغالب (Is‏ 
- معاملات بطاقات الائتمان: توفر العناصر المشتراة من خلال بطاقة ائتمانية بيانات عن منتجات 
أخرى ALS er‏ العميل بشرائها أو استخدام أرقام بطاقات الائتمان. 
- الخدمات المصرفية: يكن استخدام أنماط الخدمات المتسلسلة التي يستخدمها العملاء (فحص الحساب 
متبوعًا بحساب التوفير) لتحديد الخدمات الأخرى التي قد يكونون مهتمين بها (حساب استثماري). 
- منتجات خدمات التأمين: يمكن استخدامٌ حزم منتجات التأمين التي يشتريها العملاء (التأمين 
على السيارات يتبعها التأمين المنزلي) لاقتراح منتجات تأمين إضافية (التأمين على الحياة)» أو 
مزيج غير gole‏ من مطالبات التأمين يمكن أن يكون ile.‏ على الاحتيال. 
- خدمات الاتصالات: تساعد مجموعات الخيارات التي تم شراؤها بشكل عام (مثل: انتظار 
LLAI‏ وهوية المتصلء والاتصال (GWI‏ على تكوين حزم المنتجات بشكل أفضل لزيادة 
الإيرادات. وينطبق الشيء نفسه على gay‏ خدمات الاتصالات المتعددة القنوات من خلال 
الهاتف والتلفزيون وعروض خدمة الإنترنت. 
- السجلات الطبية: يمكن أن تشير توليفات معينة من الحالات إلى زيادة خطر حدوث مضاعفات 
مختلفة؛ أو يمكن ربط بعض إجراءات العلاج في بعض المرافق الطبية بأنواع معينة من العدوى. 
إن أفضل سؤال ينبغي طرحه فيما بخص الأماط/ العلاقات التي هكن أن تكتشفها قواعد 
مجموعات الاستخراج هو Ja»‏ كل قواعد الترابط مثيرة للاهتمام ومفيدة؟» وللإجابة عن سؤال من 
هذا القبيل؛ فإن قواعد ترابط الاستخراج تستخدم مقياسين شائعين: الدعم والاعتدال والرفع. وقبل 
تعريف هذه المصطلحات؛ دعنا نحصل على القليل من التقنية من خلال إظهار شكل قاعدة الارتباط: 
إحاسب محمولء برامج مكافحة الفيروسات] ١‏ إخطة الخدمة الموسعة] [AVe XY]‏ 
حيث ترتبط X‏ (المنتجات أو الخدمةء تسمى الجانب الأيسرء LHS‏ أو سابقة) ب Y‏ (المنتجات 
أو الخدمة» وتسمى الجانب الأهنء RHS‏ أو مرافقه). و5 هو الدعم» Cs‏ هي الثقة لهذه 
القاعدة الخاصة. فيما ياي الصيغ البسيطة ل Confs Supp‏ واا 
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إن الدَّعم (S)‏ مجموعة من المنتجات هو مقياس مدى تكرار ظهور هذه المنتجات أو الخدمات 
(مثل LHS + RHS‏ = الحاسب المحمول وبرامج مكافحة الفيروسات وخطة الخدمة الموسّعة) 
في نفس المعاملة؛ x‏ نسبة المعاملات في مجموعة البيانات التي تحتوي على جميع المنتجات أو 
الخدمات المذكورة في قاعدة مُحدّدة. وفي هذا JEBI‏ كانت XVe‏ من جميع المعاملات في قاعدة 
بيانات المتجر الافتراضية تحتوي على جميع المنتجات الثلاثة ا موجودة في بطاقة مبيعات واحدة. 
ثقة القاعدة هي مقياس مدى تلازم المنتجات أو الخدمات في RHS‏ (الناتجة) مع المنتجات أو 
Mp‏ على نظام xs SL) LHS‏ نسبة المعاملات التي تتضمّن نظام LHS‏ في حين تتضمّن 
-RHS AJ‏ وبعبارة أخرى؛ فإن الاحتمال المشروط هو العثور على RHS‏ للقاعدة الموجودة في 
المعاملات التي بُوجَّد بها بالفعل نظام LHS‏ للقاعدة. وقيمة الرفع لقاعدة الارتباط هي نسبة 
ثقة القاعدة والثقة المتوقعة من القاعدة. eig‏ تعريف الثقة المتوقعة للقاعدة على أنها نتاج قيم 
دعم LHS‏ و2115 مقسومًا على دعم نظام LHS‏ 
وتتوفر čás‏ خوارزميات لاكتشاف قواعد ind‏ إذ تتضمّن بعض الخوارزميات ال معروفة 
Eclats Apriori‏ بالإضافة إلى .FP-Growth‏ وتقوم هذه الخوارزميات فقط بنصف call‏ وهو 
تحديد العناصر المتكررة في قاعدة البيانات. ex Te‏ تحديد العناصر المتكررة؛ فإنها تحتاج إلى 
تحويلها إلى قواعد مع الأجزاء السابقة واللا قة؛ إذ Ó]‏ تحديد القواعد من المواد المتداولة هو 
عملية مطابقة 0 لكن العملية قد تستغرق وقنًا طويلًا مع قواعد بيانات المعاملات الكبيرة. 
وعلى الرغم من أنه يمكن أن يكون هناك العديد من العناصر في JS‏ مقطع من القاعدة؛ Óp‏ 
الجزء الذي يترتب على ذلك Bale‏ ما يحتوي على عنصر واحد. وفي القسم التالي سوف نتناول 
شرح إحدى الخوارزميات الأكثر شيوعًا لتحديد العناصر المتكررة. 
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خوارزمية :Apriori‏ وهو النظام الأكثر استخدامًا لاكتشاف قواع د الارتباط. وبالنظر إلى 
مجموعة من العناصر (مثل مجموعات من معاملات البيع بالتجزئةء وكل عنصر من العناصر 
الفردية التي تمّ شراؤها). تحاول هذه الخوارزمية العثور على مجموعاتٍ فرعية شائعة على الأقل 
dol Xe‏ لعدد العناصر (أَيْ: إنها تتوافق مع الحد الأدنى من الدعم). ويستخدم Golul Apriori‏ 
من القاعدة إلى القمة؛ إذ يتم توسيعٌ مجموعات فرعية متكررة عنصرًا ils‏ في JS‏ مرة (وهي 
طريقة تُعرّف باسم جيل المرشح؛ إذ Soja‏ حجم المجموعات الفرعية المتكررة من مجموعات فرعية 
ذات pais‏ واحد إلى مجموعاتٍ فرعية من فئتين» ثم مجموعات فرعية ثلاثية العناصر... الخ)» Q5‏ 
اختبار مجموعاتٍ من المرشحين في كلّ مستوى ضد البيانات؛ للحصول على ŽA‏ الأدنى من الدعم. 
وتنتهي الخوارزمية عند عدم العثور على ملحقات إضافية ناجحة. 

وكمثالٍ توضيحي: gó‏ في اعتبارك ما يلي: يتتبع متجر البقالة عمليات نقل المبيعات بواسطة 
SKU‏ (وحدة حفظ المخزون)»» وبالتالي يعرف العناصر التي يتم شراؤها aLe‏ معًا. يظهر في 
الشكل ١6-6‏ قاعدة بيانات المعاملات, إلى جانب الخطوات اللاحقة لتحديد العناصر المتكررة. 
وکل رمز SKU‏ في قاعدة بيانات المعاملة يتحول إلى «aas‏ مثل: »1 = «bread = 2»5 «butter‏ 
و«3 = «water‏ وما إلى ذلك. تتمثل الخطوة الأولى في Apriori‏ في حساب الترددات sl)‏ 
الدعامات) لكل polis) pais‏ من عنصر واحد). ولهذا المثال المبسّط بشكل كبير» beo‏ نعيّن 
الحد god‏ للدعم إلى Y‏ (أو o.‏ مما يعني أن العنصر D, Sa pais AR‏ إذا 3 عرضه في 
Y‏ من أصل ٦‏ معاملات على الأقل في قاعدة البيانات). ونظرًا GY‏ جميع العناصر المكونة من 
عنصر واحد تحتوي على Y‏ على الأقل في agas‏ الدعم؛ فكلها polis X33‏ متكررة. ومع ذلك؛ فإنه 
إذا م تكن iS‏ من polis‏ المجموعة الواحدة متكررة؛ فلن يتم إدراجها كعضو محتمل في زوجين 
من النقاط محتملين. وبهذه Apriori jja Äi hi‏ شجرة جميع العناصر الممكنة. وكما يوضح 
الشكل NE-E‏ فإنه باستخدام polis‏ مجموعة واحدة يتم إنشاء جميع polis‏ العناصر اممكنة 
ويتمٌ استخدام قاعدة بيانات المعاملة لحساب قيم الدعم الخاصة بها. ونظرًا لأن عنصر العناصر 
المكون من عنصرين ]0 Y‏ يحتوي على دعم أقل من ؛ فلا يجب تضمينه في العناصر المتكررة 
التي سيتمٌ استخدامها لإنشاء مجموعات العناصر التالية polis)‏ من العناصر الثلاثة). وتبدو 
هذه الخوارزمية بسيطةً بشكل خادع؛ ولكن فقط لمجموعات البيانات الصغيرة. أما في مجموعات 
البيانات الأكبر بكثير - خاصة تلك التي تحتوي على كميات هائلة من العناصر الموجودة بكميات 
منخفضة وكميات صغيرة من العناصر اللوجودة في كميات كبيرة - فإن البحث والحساب يصبح 
عملية مكثفة من حيث الحساب. 
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مجموعات ayh‏ ثلاثية البتد ‏ مجموعات بنود NaS‏ مجموعات بنود أحادية البند بيانات العملية الخام 

مجموعة البند مجموعة البند SKUs‏ رقم 

(Skus) kusy | e?‏ ركم البند العملية 
3 12,4 3 1 | | 1.2.3.4 | 100234 
3 23.4[ | 6 2 | 2.3.4 | 1001235 
l5 4 |‏ 2.3 1001236 
L4 5 |‏ 1.2.4 | 1001237 
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شكل :Y6-€‏ تحديد مجموعات البنود المتكررة في خوارزمية Apriori‏ 


أسئلة مراجعة على القسم 0-6: 

axe -١‏ على الأقل ثلاث طرق من الطرق الرئيسة للتنقيب في البيانات. 

-Y‏ اذكر أمثلة عن مواقف يكن أن يكون فيها التصنيف أسلوباً مناسباً للتنقيب في البيانات. 
واذكر أمثلة على الحالات التي يكون فيها الانحدارٌ أسلوبًا مناسبًا للتنقيب في البيانات. 

-Y‏ اذكر على الأقل اثنين من تقنيات التصنيف مع تعريفٍ موجز لهما. 

-٤‏ ما هي بعض المعايير لمقارنة واختيار أفضل تقنية للتصنيف؟ 

0- صف باختصار الخوارزمية العامة المستخدمة في أشجار القرار. 

1- عرّف مؤشر جيني. واذكر ماذا يقيس؟ 

-V‏ ما هو نموذج المجموعة في مجال التنقيب في البيانات؟ ما هي مزايا وعيوب نماذج المجموعة؟ 

-A‏ اذكر dits]‏ للمواقف التي سيكون فيها التحليل التجميعي dud‏ مناسبةٌ لاستخراج البيانات. 

4- ما هو الفرق الرئيس بين التحليل التجميعي والتصنيف؟ 

-٠١‏ اذكر بعض طرق التحليل التجميعي؟ 

-١‏ اذكر dla]‏ على الحالات التي يكون فيها الارتباط تقنية مناسبة للتنقيب في البيانات. 


€-1 أدوات برمجيات التنقيب في البيانات: 


يوفر العديدٌ من مورّدي البرامج أدواتٍ قويةً للتنقيب في البيانات. من أمثلة هؤلاء الموردين: 
- شر ركة IBM SPSS Modeler) MBI‏ وامعروفة سابقًا (Clementines SPSS PASW Modeler gwl‏ 
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التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


- شركة SAS‏ (رائدة ال مشروعات). 
- شر Statistica) Dell às,‏ والمعروفة سابقًا باسم «(StatSoft Statistica Data Miner‏ 
Infinite Insight) PAS às, 2‏ والمعروف ÓL.‏ باسم .(KXEN Infinite Insight‏ 
- أنظمة سالفورد CART, MARS, TreeNet, RandomForest)‏ 
- شركة -Angoss (KnowledgeSTUDIO, KnowledgeSEeker)‏ 
-Megaputer (PolyAnalyst) 4$ 5 -‏ 

بشكل ملحوظ ولكن ليس من المستغرب, يتم تطوير أدوات التنقيب في البيانات الأكثر شيوعًا 
واستخدامًا من قبل شركات البرمجيات الإحصائية الراسخة إلى حد كبير (مثل (SAS, SPSS, StatSoft‏ 
لأن الإحصاءات هي أساس التنقيب في البيانات» وهذه الشركات لديها وسائل فعالة من حيث 
التكلفة تقوم بتطويرها في أنظمة الإستخراج الشامل للبيانات. كما أن معظم 52552 أدوات ذكاء 
JU. eSI‏ (مثل: -Tableaus «SAP Business Objects; «Oracle Hyperions IBM Cognos‏ 
.Qliks «Tibco‏ و (Microsofts Teradatas MicroStrategy‏ لديهم أيضًا مستوى معين من 
قدرات التنقيب في البيانات امُدمَجة في عروض البرامج الخاصة بهم. ولا تزال أدوات ذكاء الأعمال 
هذه ترز في امقام الأول على النمذجة المتعددة الأبعاد وتصوير OBLI‏ ولا S‏ منافسةٌ مباشرة 
مورّدي أدوات التنقيب في البيانات. 

إضافة إلى هذه الأدوات التجارية؛ تتوفر العديدٌُ من أدوات برمجيات جمع البيانات املفتوحة 
المصدر أو المجانية على الإنترنت. وبشكلٍ بديهي - ولا سيما في الإدارات التربوية - Weka iå‏ أداة 
التنقيب في البيانات المجانية والمفتوحة الأكثر انتش ارا والتي تمّ تطويرها من قبل عد من الباحثين 
من جامعة Waikato‏ في نيوزيلندا (يمكن تنزيل الأداة من (cs. waikato.ac.nz/ml/weka‏ تحتوي 
Weka‏ على عدد uS‏ من الخوارزميات لمهامٌ مختلفة للتنقيب في البيانات ولديها واجهة 
مُستخدم سهلة الاستخدام. وقد ظهر في الآونة الأخيرة Sae‏ من الأدوات المجانية ا مفتوحة 
المصدر وذات قدرة عالية على التنقيب في البيانات: يقود المجموعة KNIME (knime.org)‏ 
-RapidMiner (quickminer.com)s‏ فلديهما واجهات مُستخدم بيانية مُحسّنة» وأيضًا بهما 
عد كبيرٌ من الخوارزميات» ومجموعة متنوعة من مَيْزات التمثيل البصري للبيانات» كل تلك 
الخصائص تميزهما عن بقية الأدوات المجانية. dads‏ هذان البرنامجان المجانيان أيضًا برنامجين 
أساسيين GSE xs‏ تشغيلهما على نظامي تشغيل (Macs Windows‏ ومع التغيير الأخير في 
عروضها؛ قامت RapidMiner‏ بإنشاء نسخة مُصغّرة من lal‏ التحليلات الخاصة بهم مجانًا 
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(أيّْ: نسخة مجتمعية)؛ وذلك في أثناء تصنيع المنتج التجاري الكامل. لذلك؛ فبمجرد إدراج 
RapidMiner‏ ضمن فئة الأدوات المجانية/ مفتوحة المصدرء غالبًا ما يتم إدراجها في قائمة الأدوات 
التجارية. iz‏ الاختلاف الرئيس بين Js‏ من الأدوات التجارية (مثل: SAS Enterprise Miner‏ 
(Statisticas IBM SPSS Modeler g‏ والأدوات المجانية (مثل: «RapidMinerg Weka‏ 
و85 ) هو الكفاءة الحسابية. وقد تستغرق مهمة التنقيب في البيانات نفسها التي تنضمن 
مجموعة بيانات كبيرة وغنية بالميزات وقتاً أطول بكث ير لتكتمل مع أدوات الرمجيات ا مجانية 
وبالنسبة لبعض الخوارزميات» قد لا تكتمل المهمة ssl)‏ تتعطل بسبب الاستخدام غير JRA‏ 
لذاكرة الحاسب). يعرض الجدول so Y-€‏ من ال منتجات الرئيسة والمواقع الخاصة بها. 

هناك مجموعةٌ من قدرات ذكاء الأعمال والتحليلات التي أصبحت أكثر شيوعًا بشكل متزايد 
لدراسات التنقيب في البيانات» وهي Microsoft SQL Server‏ (فقد تم تضمينها لإمكانات 
تحليلات أكثر بشكل متزايدء Jis‏ ذكاء الأعمال ووحدات النمذجة التنبؤية؛ وذلك بدءًا من إصدار 
(SQL Server 2012‏ إذ ez‏ عمل مستودعات البيانات والنماذج في نفس بيئة قاعدة البيانات 
العلائقية؛ مما يجعل إدارة aga gòl!‏ أسهل بكثير. يعمل تحالف Microsoft Enterprise‏ 
كمصدر عاللمي للوصول إلى مجموعة برامج Microsoft SQL Server‏ للأغراض الأكادهية, 
كالتدريس والأبحاث. وقد تمَّ إنشاءٌ هذا التحالف؛ لتمكين الجامعات في جميع أنحاء العام 
من الوصول إلى تقنية المؤسسات دون الحاجة إلى صيانة الأجهزة والبرامج الضرورية في مبانيها 
الخاصة. كما يوفر التحالف مجموعةً واسعةً من أدوات تطوير ذكاء الأعمال (كالتنقيب في 
البيانات» بناء المكعبات» إعداد تقارير الأعمال) إضافةً إلى عدد من مجموعات البيانات الكبيرة 
والواقعية من Microsoft Enterprise Alos ks . Tyson Foodss Dillard's Sam's Club‏ 
مجانيًا ولا هكن استخدامه إلا للأغراض الأكادهية. تستضيف كلية Sam M. Walton‏ للأعمال 
بجامعة Arkansas‏ النظام المؤسسي uis‏ مح لأعضاء التحالف وطلابه بالوصول إلى هذه الموارد 
باستخدام اتصالٍ بسيط عن بعد بسطح المكتب. ويمكن معرفة تفاصيل الانضمام لهذا التحالف 
وكذلك الدروس سهلة المتابعة وبعض الأمثلة في -walton.uark.edu /enterprise‏ 
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التحليلات التنبؤية dlos :)١(‏ وطرقء وخوارزميات التنقيب في البيانات 


جدول :Y-€‏ برامج مختارة للتنقيب في البيانات 














(URL) اسم المنتج الموقع‎ 
www-0l.ibm.com/software/analytics/spss/products/ 
IBM SPSS Modeler 
modeler/ 
ibm.com/analytics/watson-analytics/ IBM Watson Analytics 
sas.com/en id/software/analytics/enterprise-miner.html | SAS Enterprise Miner 





statsoft.com/products/statistica/product-index 


Dell Statistica 





megaputer.com/site/polyanalyst.php 


salford-systems.com 


PolyAnalyst 


CART, RandomForest 





solutionmetrics.com.au/products/iminer/default.html 
solver.com/xlminer-data-mining 


help.sap.com/ii 


Insightful Miner 
XLMiner 


SAP InfiniteInsight (KXEN) 





fqs.pl/ghostminer 
msdn.microsoft.com/en-us/library/bb510516.aspx 


knowledgeminer.com 





GhostMiner 
SQL Server Data Mining 


Knowledge Miner 





teradata.com/products-and-services/Teradata- 


warehouse-miner/ 


Teradata Warehouse Miner 





oracle.com/technetwork/database/options/odm/ 


Oracle Data Mining (ODM) 





fico.com/en/analytics/decision- management-suite/ 


FICO Decision Management 





orange.biolab.si/ 


Orange Data Mining Tool 





zementis.com 





Zementis Predictive Analytics 
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في مايو ٢۲۰۱م‏ أجرت KDnuggets.com‏ استطلاع البرامج السنوي الثالث عشر بشأن السؤال 

x UII‏ «ما هي البرامج التي استخدمتها في التحليلات» والتنقيب في البيانات» وعلم البيانات» ومشاريع 

es‏ الآلة خلال ال ١١‏ شهرًا الماضية؟». وقد حظي الاستطلاع بمشاركة رائعة من مجتمع التحليلات 

وعلم البيانات والمورّدين؛ مما جذب Gab ١885‏ اختاروا Ias‏ قياسيًا بلغ ؟١٠‏ من الأدوات المختلفة. 

وقد أثمر هذا الاستطلاع عن بعض النتائج المثيرة للاهتمام منها: 

- لا تزال R‏ هي الأداة الرئيسةء بحصة تبلغ >6٩‏ من الأسهم (بعد أن كانت ZETA‏ في عام pY- YO‏ 
ولكن استخدام Python‏ ازداد بسرعة واكتسب ما يقرب من R‏ بحصة 60,8“ من الأسهم 
(والتي توقفت عند ۳۰,۳ في ١10‏ م). 

- لا تزال RapidMiner‏ هي المنصة العامة الأكثر Usa‏ بشأن التنقيب في البيانات/ ele‏ البيانات» 
بنسبة بلغت ZYY‏ من الأسهم. ومن الأدوات البارزة التي تحظى بأكبر قدر من النمو في الانتشار 
هي Scikit- 9 «Amazon Machine Learnings «H209 .MLlibs .Dataikus «Dato‏ 
.IBM Watsons dearn‏ 

- ينعكس الخيار المتزايد للأدوات في الاستخدام الأوسع؛ S|‏ بلغ متوسط عدد الأدوات المستخدمة 
۰ (مقابل £A‏ في (EYO silo‏ 

- ارتفع استخدام أدوات /Hadoop‏ البيانات الكبيرة إلى XPA‏ بعد أن كان ۲۹× في عام 10١٠م‏ 
و۷ في عام Y+ VE‏ مدفوعًا من قبل MLlibs Apache Spark‏ (مكتبة Spark‏ لتعلم الآلة) 
و5120. والتي أدرجناها ضمن أدوات البيانات الكبيرة. 

- كانت المشاركة حسب المنطقة؛ وذلك كالتالي: الولايات المتحدة / كندا (AE)‏ أوروبا (XYI)‏ آسيا 
)00,6 أمريكا اللاتينية (0,۸)» أفريقيا / الشرق الأوسط (۲,۹<)» أستراليا / نيوزيلندا AAYY)‏ 

- في هذا العام» استخدم XAT‏ من المصوتين برامج تجاريةء في حين استخدم ۷0< البرامج المجانية. 
واستخدم حوالي <۲١‏ فقط البرامج التجارية. و١‏ فقط استخدموا البرامج المفتوحة المصدر / 
المجانية. واستخدم الأغلبية بمقدار 20 كلا من البرامج ا مجانية والتجارية على خَذَّ سواء في 
حين كانت 71€ في عام 16١لام.‏ 

- بالنسبة للسنة Lat‏ شمل استطلاع KDnuggets.com‏ أدوات ele‏ العميق. ففي هذا 
العام استخدم 1۸< من المصوتين أدوات التعلم العميقء أيْ: ضعف نسبة عام ۲١٠١‏ والتي 
كانت 4> وبهذا قفز موقع Google Tensorflow‏ إلى المركز الأول» متخطيًا النظام البيئي 
2 صاحب الصدارة في العام الماضي. l‏ 
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التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 


- في مجتمع لغات البرمجةء ارتفعت شعبية ds‏ من Scalag Unixs Javas Python‏ في حين 


„Lispo «Clojures F و#‎ Julias Perl «C/C++ من‎ js انخفضت شعبية‎ 


A sls‏ من التحيّر à‏ التصويت المتعدّد؛ قام موقع  KDnuggets.com‏ هذا الاستطلاع 
بالتحقق من البريد الإلكتروني؛ وذلك بهدف جَعْل النتائج أكثر تمثي لا للواقع في عام التحليلات. 
ويُظهر في الشكل 10-6 نتائج لأفضل ٠١‏ من الأدوات البرمجية (وذلك وفقًا لإجمالي عدد الأصوات 
المستلمة). كما يقوم الرسم البياني الأفقي أيضًا بالتمييز بين الأدوات المجانية/ مفتوحة المصدر 


yao 


والتجارية وبيانات Hadoop‏ / البيانات الضخمة باستخدام مخطط الترميز ذي الألوان. 





يفت 
أدوات مجانية أخرى للتحليلات اللتتغيب فى 9399[ 
لفك برمجة وبواقفت لغري 
H20‏ 
Scala‏ 
SAS Enterprise Miner‏ 
Microsoft Power Bi‏ 
Hbase‏ 
Oik View‏ 
Macrosoft Azure Machno‏ 


Learning 
HDPSiHadoop على‎ i3 أدواث أخري‎ 


Saford SPMICART/RFIMARS/TreeNel 
Gnu Oclave 


























Source: used with permission from KDnuggets 
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حالة عملية 5-6 
التنقيب في البيانات ينتقل إلى هوليوود: توقع النجاح المالي للأفلام 

تتعلّق الحالة العملية 6-” بدراسة بحثية؛ إذ يتخ استخدام Sae.‏ من الأدوات البرمجية 
وتقنيات جمع البيانات لبناء تماذج التنقيب في البيانات؛ للتنبؤ بالنجاح المالي (إيرادات 
شباك التذاكر) لأفلام هوليوود في حين أنها ليست أكثر من مجرد أفكار. 

dad‏ توقع إيرادات شباك التذاكر ssl)‏ النجاح (JUI‏ لصورة متحركة معينة؛ مشكلةٌ 
yio‏ للاهتمام dtes‏ بالتحديات. ووفقاً لبعض خبراء المجال؛ فإن صناعة السينما 
i55‏ «أرض العقبات واي مخاطر الجامحة»؛ بسبب الصعوبة ال مرتبطة بالتنبؤ بالطلب 
على المنتج؛ مما يجعل أعمال السينما في هوليوود محفوفةً با مخاطر. ودعمًا Jil‏ 
هذه الملاحظات. يقول Jack Valenti‏ (الرئيس والمدير التنفيذي السابق لاتحاد الصور 
المتحركة الأمريكية): «لا أحد يستطيع أن يخبرك كيف سينتج الفيلم في السوق. ليس 
قبل أن يفتح الفيلم في مسرح مظلم» والشرر يطير بين الشاشة والجمهور». وقد 
كانت الصحف والمجلات التجارية الخاصة بصناعة الترفيه مليئةٌ بالأمثلة والتصريحات 
والخبرات التي تدعم مثل تلك المطالب. 

وكما هو الحال بالنسبة للعديد من الباحثين الذين حاولوا إلقاء الضوء على هذه المشكلة 
المليئة بالتحَدّيات في العام الحقيقيء كان ds‏ من Dursun Deleng «Ramesh Sharda‏ 
يستكشفان استخدام التنقيب في البيانات؛ للتنبؤ بالأداء UI‏ للصورة المتحركة في شباك 
التذاكر قبل أن يدخل الإنتاج (في حين أن الفيلم ليس أكثر من فكرة مفاهيمية). do‏ نماذج 
التنبؤ ذات الانتشار الكبيرء يتم تحويل مشكلة التنبؤ sl)‏ الانحدار) إلى مشكلة تصنيف؛ 
بمعنى أنه بدلا من التنبؤ بتقدير نقطة لإيرادات شباك التذاكر؛ يتم تصنيف (sl‏ فيلم ds‏ 
لإيراداته ووضعه في إحدى الفئات التسع. والتي تتراوح من الهبوط الشديد «flop»‏ إلى 
الإقبال «blockbuster»‏ مما يجعل المشكلة مشكلة تصنيف متعددة الحدود. ويُوضُح 
الجدول Y-€‏ تعريف الفئات التسع من حيث US‏ إيصالات شباك التذاكر. 





TABLE 4.3 Movie Classification Based on Receipts 
Cass No. ١ 2 3 4 $£ $ 7 8 9 
Range >| >l > >Ð > »6 >W <5 m 


(in miliions <60 «X «64 «6&6 «6K0 «6I «6X0 
aí dolan) (fy) (Bodiuser) 
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البيانات: 

تمّ جمع البيانات من مجموعة متنوعة من قواعد البيانات المتعلقة بالأفلام (مثل: 
(L 4&5 «BoxofficeMojos .AllMovies IMSDbs IMDbs «Showbiz‏ وقد e‏ 
دمجها جميعًا في مجموعة بيانات واحدة؛ 5 تحتوي مجموعة البيانات الخاصة بأكثر 
النماذج تطورًا في الآونة الأخيرة على ۲۱۳۲ فيلماً تمّ إصدارها بين عامي 1998 Yta‏ 
ويعرض الجدول €-€ ملخصاً للمتغيرات المستقلة إلى جانب مواصفاتها. ولمزيدٍ من 
التفاصيل الوصفية ومبرّرات تضمين هذه المتغيرات المستقلة؛ يتم الاطلاع على JS‏ من 
Sharda‏ و(2006) .Delen‏ 


جدول €-£: ملخص للمتغيرات المستقلة 



































المتغير المستقل القيم الممكنة 
تصنيف الاتحاد الا التحركة 
Sasa :‏ للصور اممتحر G, PG, 20-13, R, NR‏ 

MPAA 

المنافسة مرتفع» متوسط منخفض 

قيمة النجم Y‏ مرتفع» متوسط منخفض 
خيال علميء دراما ملحمية تاريخية: دراما 

النوع الأدبي ٠‏ إحديثة. سياسة. إثارة. رعبء كوميدياء كرتون» 
حريء وثائقي 

مؤثرات خاصة Y‏ مرتفع» متوسط منخفض 

متمم Y‏ نعم لا 

عدد الشاشات 1 عدد صحيح موجب بين Y‏ و٣۳۸۷‏ 

المنهجية: 


باستخدام مجموعة متنوعة من أساليب التنقيب في البيانات» ها في ذلك الشبكات 
العصبية وأشجار القرار وآلة المتجهات الداعمة وثلاثة أنواع من ا مجموعات؛ Js pb‏ من 
Deleng Sharda‏ بتطوير تماذج التنبق. وقد تمّ استخدامٌ بيانات الحقبة الزمنية من 
۸ إلى ۵١١۲م‏ كبيانات تدريبية لبناء نماذج التنبق في حين استخدمت بيانات عام 
eY «n‏ كبيانات اختبار لتقييم ومقارنة d$»‏ التنبؤات في النماذج. ويعرض الشكل ٠١-٤‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yay‏ 


gll الفصل‎ 


لقطة شاشة من IBM SPSS Modeler‏ (أداة التنقيب à‏ البيانات (tlw Clementine‏ 
التي تصوّر خريطة العملية ا مستخدمة لمشكلة التنبؤ؛ إذ يعرض الجانب الأيسر العلوي 
للخريطة عملية تطوير النموذج ويعرض الركن السغني الأهمن من الخريطة عملية 
تقييم النموذج sl)‏ الاختبار أو التسجيل). ولمزيدٍ من التفاصيل حول أداة IBM SPSS‏ 

Modeler‏ وكذلك استخدامها فَيُرْجَى الرجوع إلى موقع الكتاب على شبكة الإنترنت). 














شكل 15-6: لقطة لتدفق عملية نظام التنبؤ بشباك التذاكر 


النتائج: 

eX o‏ الجدول 0-6 نتائج Sual‏ لجميع طرق الجمع الثلاث للبيانات بالإضافة إلى 
نتائج المجموعات الثلاث المختلفة. a5‏ أول قياس للأداء هو معدل التصنيف الصحيح 
للنسبة isih]‏ ويُطلّق عليه «bingo»‏ وكما ورد في الجدول معدل التصنيف الصحيح 
I-Away‏ (أيْ: ضمن فثة واحدة). تشير النتائج التي يعرضها الجدول إلى أن SVM‏ كان 
أفضل نماذج $a‏ الفرديةء يليها ANN‏ في حين co‏ خوارزمية شجرة قرار CART‏ في 
المركز الأخير كأسوا تموذج. بشكلٍ tele‏ حققت نماذج المجموعة lol‏ أفضل من نماذج 
التنبؤ الفرديةء التي أدّت خوارزمية الاند ماج فيها أفضل elo]‏ ممكن. ids‏ الانحراف 
ا معياري المنخفض للغاية الذي تم الحصول عليه من ا مجموعات هو - على الأرجح - 
أكثر أهمية لصانعي القرار وقراءة جدول النتائج. مقارنة بالتماذج الفردية. 


YSA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 


جدول €-0: نتائج التنبؤ المجدولة للنماذج الفردية والجماعية 








نماذج التنبؤ 
النماذج ۴ 
: النماذج الجماعية 
الفردية 





الغابة | الشجرة | الاندماج 
العشوائية | المدعومة | (متوسط) 
العد yae | WY | 185 poe | WY | 1۹۲ | (bingo)‏ 


CART | ANN | SVM | مقياس الأداء‎ 








Wwe Mt wt 11 Wwe 1£ (1-Away) العد‎ 





Xow.V | X0t£,.0 | ZW,ot | X&£«,£3 | 21,0۲ | Z£3,00 | (Zbingo) الدقة‎ 





XAVO | ZYSA€ | ZA, TS | ZAAVA | ZYA,AY | ZA0,00 | (<1-Away) الدقة‎ 























الانحراف العياري | SV | ار١ | SAY | SY.‏ | ع | ليه 





الاستنتاج: 
cel‏ الباحثون GE‏ نتائج التنبؤ هذه أفضل من Gİ‏ تقارير منشورة فيما يتعلق 
بنطاق هذه المشكلة. وبالإضافة إلى الدقة الجذابة لنتائج التنبؤ بإيرادات الشباك؛ 
dil‏ هكن استخدام هذه النماذج كذلك لتحليل متغيرات القرار (وربما تحسينها) 
لتعظيم العائد المالي. وعلى وجه التحديد؛ هكن تغبير المعلمات المُستَخدّمة 
للنمذجة باستخدام نماذج التنبؤ المجرّبة بالفعل للوصول إلى فهم أفضل لتأثير 
المعلمات المختلفة على النتائج النهائية. وخلال هذه العملية والتي LL‏ عادةٌ 
«تحليل الحساسية»؛ يمكن لصانع القرار في إحدى الشركات الترفيهية أن يكتشف» 
بمستوى دقة Jle‏ إلى 45 ماه مقدار قيمة النجاح UI‏ التي يمكن أن يحققها ممثل 
معين (أو تاريخ صدور محدد. أو إضافة المزيد التأثيرات الفنية... إلخ)؛ مما يجعل 
النظام الأساسي أداةً لا JÄ‏ بثمن لدعم القرار. 
أسئلة للمناقشة: 
ILL -١‏ يعتبر Sz]‏ بالنجاح UL‏ للأفلام od‏ مهما بالنسبة للعديد من صناع 
السينما في هوليوود؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yaa‏ 


الفصل الرابع 


-Y‏ كيف هكن استخدام التنقيب في البيانات للتنبؤ بالنجاح المالي للأفلام قبل بدء 
عملية الإنتاج؟ 

-Y‏ كيف تعتقد أن هوليوود نجحت في هذه المهمة إلى الآن دون مساعدة من 
أدوات وتقنيات التنقيب في البيانات؟ 


Sources: Sharda, R., & Delen, D. (2006). Predicting box-office success of motion 
pictures with neural networks. Expert Systems with Applications, 30, 243254-; 
Delen, D., Sharda, R., & Kumar, P. (2007). Movie forecast Guru: A Web-based DSS 
for Hollywood managers. Decision Support Systems, 43(4), 11511170-. 


أسئلة مراجعة على القسم 5-6: 

-١‏ ما هي أدوات التنقيب في البيانات التجارية ASY‏ انتشارًا؟ 

-Y‏ اذا تعتقد أن أكثر الأدوات انتشارًا يتم تطويرها من قبل الشركات القائمة على الإحصاء؟ 

*- ما هي أكثر أدوات التنقيب في البيانات المجانية انتشارًا؟ ولماذا تتمتع بهذا الانتشار الهائل (خاصة S(R‏ 

-E‏ ما هي الاختلافات الرئيسة بين أدوات البرمجيات التجارية وأدوات التنقيب في البيانات المجانية؟ 

0- ما هي معايير الاختيار الخمسة الأولى لأداة التنقيب في البيانات؟ اشرح إجابتك. 

۷-٤‏ مشكلات خصوصية التنقيب في البيانات» والخرافات» والأخطاء الفادحة: 
غالبًا ما تحتوي البيانات التي يتم جمعها وتخزينها وتحليلها في مجال التنقيب في البيانات على 

معلومات حول الأشخاص الحقيقيين. وقد تتضمن هذه المعلومات ما يلي: 

-١‏ بيانات التعريف (الاسم» والعنوان» ورقم الضمان الاجتماعي» ورقم رخصة القيادة ورقم 
الموظفء وما إلى ذلك). 

-Y‏ البيانات الدهوغرافية (مثل: العمرء والجنسء والعرق» والحالة الاجتماعيةء وعدد الأطفال). 

-P‏ البيانات AJU‏ (مثل: الراتب» أو دخل الأسرة الإجمالي» أو التحقق من رصيد الحساب أو التوفيرء 
أو ملكية المنزل» أو تفاصيل حساب الرهن العقاري أو القرضء أو حدود بطاقات الائتمان 
والأرصدة, أو تفاصيل حساب الاستثمار). 

£- تاريخ الصفقات xS) iatl‏ ما يتم شراؤه من أين ومتى» سواء من سجلات المعاملات الخاصة 
بالبائع أو من المعاملات الخاصة ببطاقة الائتمان). 

0- البيانات الشخصية (مثل: ذكرى الزواج السنويةء الحملء المرضء الوفيات في lili‏ إيداعات الإفلاس). 


£e‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 


ويمكن الوصول إلى معظم هذه البيانات من خلال بعض مقدَّمي البيانات التابعين لجهات 
خارجية. والسؤال الرئيس هنا هو عن خصوصية الشخص الذي تنتمي إليه البيانات. وللحفاظ 
على خصوصية وحماية حقوق الأفراد؛ يجب أن يتمتع متخصصو التنقيب في البيانات بسمات 
أخلاقية فضلا عن الالتزامات القانونية. وتتمثل إحدى طرق تحقيق ذلك في عملية إلغاء تحديد 
سجلات العملاء قبل تطبيق تطبيقات التنقيب في البيانات؛ بحيث لا هكن تتبّع السجلات للفرد. 
وقد تمَّ بالفعل إلغاء تحديد العديد من مصادر البيانات المتاحة للجمهور (مثل: بيانات CDC‏ 
بيانات SEER‏ بيانات (UNOS‏ وقبل الوصول إلى مصادر البيانات هذه. يُطلب من المستخدمين 
في كثير من الأحيان الموافقة على أنهم - تحت أيّ ظرف من الظروف - سيحاولون تحديد هوية 
الأفراد الذين يقفون وراء هذه الأرقام. 

كان هناك Sae‏ من الحالات في الماضي القريب؛ إذ شاركت بعض الشركات بيانات العملاء 
مع الآخرين دون الحصول على موافقة صريحة من عملائها. فعلى سبيل المثال - كما قد يتذكر 
معظمكم - في عام ١٠٠٠م,‏ قدّمت شركة JetBlue Airlines‏ السجلات الخاصة بأكثر من مليون 
مسافر من عملائها لشركة Torch Concepts‏ وهي مقاولة حكومية أمريكية. ثم قامت Torch‏ 
بعد ذلك بتعزيز بيانات الركاب بمعلومات إضافية» مثل: أحجام العائلة وأرقام الضمان الاجتماعي» 
وهي معلومات تم شراؤها من وسيط بيانات يُسمّى Acxiom‏ وكان القصد من قاعدة البيانات 
الشخصية الموحّدة أن تُستخدّم في مشروع التنقيب في البيانات؛ بغرض التنبؤ بملامح الإرهاب 
المحتمل. وقد $3 US‏ هذا دون إخطار أو موافقة الركاب. وعندما خرجت أخبار تلك الأنشطة؛ 
تم تقديمٌ العشرات من قضايا الخصوصية ضد leag -Acxioms Torch 5 JetBlue‏ العديد من 
أعضاء مجلس الشيوخ الأمريكي إلى إجراء تحقيق في الحادث )2004 (Wald,‏ وخرجت في الماضي 
القريب ABlsa Suo]‏ متعلقة بالخصوصية عن شركات الشبكات الاجتماعية الشهيرة والتي أشيع 
أنها كانت تبيع بيانات خاصة بالعملاء إلى شركات أخرى للتسويق المستهدف الشخصي. 

كانت هناك قصة غريبةٌ أخرى عن مخاوف الخصوصية التي وصلت إلى عناوين الأخبار في عام 
Y‏ م. في هذه الحالةء لم تستخدم الشركة حتى أي بيانات خاصة و/ أو شخصية. من الناحية 
القانونية: لم يكن هناك انتها لأية قوانين. وتلخص الحالة العملية ۷-٤‏ تلك القضية - وا متعلقة 
بشركة Target‏ - بشيء من التفصيل. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري E‏ 


الفصل الرابع 


حالة عملية ۷-٤‏ 
توقع أنماط شراء العملاء - قصة Target‏ 

تدور القصة حول فتاة مراهقة كانت تشارك منشورات إعلانية وكوبونات من قبل 
elg Target‏ الأشياء التي تشتريها السيدة الحامل للمرة الأولى من متجر مثل "Target‏ 
تقول القصة: ذهب رجل غاضب إلى شركة Target‏ خارج Minneapolis‏ مطالبًا 
بالتحدث إلى أحد المديرين؛ فقال: «استلمت ابنتي هذا منكم عن طريق البريد. إنها 
لا تزال في المدرسة الثانوية وترسلون لها كوبونات ملابس الأطفال وأسرّة الأطفال حديثي 
YI‏ هل تحاولون تشجيعها على الحمل؟». مم يكن لدى i$] pal‏ فكرة e‏ يتحدث 
عنه الرجل. نظر في المرسّل؛ فوجد أنها كانت موجّهة إلى ابنة الرجل وتضمّنت إعلانات 
عن ملابس الأمومة وأثاث الحضانة وصور الرضع. اعتذر المدير ثم اتصل بعد بضعة أيام 
على الهاتف للاعتذار ya‏ أخرى. ومع ذلك؛ بدا الأب متضايقاً إلى d>‏ ما عندما $ على 
المدير قائلًا: «لقد تحدثت مع ابنتي orn‏ لي أن هناك بعص الأنشطة في منزلي م أكن على 
دراية بها. إنها في انتظار مولودها الأول بالفعل وأنا Sos‏ لك باعتذار». ولكن السؤال 
هنا كيف عرفت Target‏ أن الفتاة كانت حاملًا قبل اكتشاف والدها للحقيقة؟ وفيما 
يلي الإجابة عن هذا السؤال: إن شركة Target‏ تُخصّص لكل عميل رقم بطاقة تعريف 
كضيف لديها (مرتبطة ببطاقة الائتمان» أو الاسم» أو عنوان البريد الإلكتروني) الذي يصبح 
عنصرًا نائبًا يحتفظ بسجلٍ لكل ما اشتراه. وتقوم Target‏ بتعزيز هذه البيانات db‏ 
معلومات دهوغرافية قاموا بجمعها من العملاء أنفسهم. أو تم شراؤها من مصادر 
معلومات أخرى. وباستخدام هذه المعلومات؛ نظرت Target i Så‏ في بيانات الشراء 
السابقة لجميع الإناث اللواق قمن بتسجيل أسمائهن في سجلات أمهات الأطفال المنتظر 
استقبالهم. وقاموا بتحليل البيانات من جميع الاتجاهات. وسرعان ما ظهرت بعض 
الأماط المفيدة. فعلى سبيل JÈL‏ كانت مستحضرات اللوشن والفيتامينات الخاصة 
من بين المنتجات ذات أنماط الشراء المثيرة للانتباه. فالكثيرٌ من الناس يشترون اللوشن» 
ولكن ما لاحظوه هو أن السجلات التي تحتوي على بيانات سيدات ينتظرن أطفال 
يقمن بشراء كميات أكبر من محلول اللوشن غير المعطر مع بداية الثلث الثاني من فترة 
الحمل. ولاحظ محلل آخر أنه في وقت ما في الأمابيع العشرين الأولى من فترة الحمل, 
تقوم النساء الحوامل بالاعتماد على المكملات مثل: الكالسيوم والمغنيسيوم والزنك. كما 
يقوم العديدٌ من المتسوقين بشراء صابون وكرات قطنية» ولكن عندما تبدأ سيدة ما فجأة 


er‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


بشراء الكثير من الصابون الخالي من الرائحة وأكياس كبيرة من كرات القطنء بالإضافة إلى 
مطهرات اليد ومناديل الحمام؛ فإن ذلك يشير إلى قرب موعد استقبالها لمولودها. وقي 
النهاية؛ lod‏ من تحديد حوالي ۲۵ منتجّاء عندما تم تحليلها dia‏ مكنتهم من تحديد 
درجة توقع وجود حمل من عدمه لكل متسوق. والأهم من ذلك؛ استطاعت Target‏ 
أيضًا تقدير تاريخ الولادة لكلّ سيدة حامل؛ لذلك يتم إرسال كوبونات منتجات معينة 
بتواريخ مُحدّدة لكلّ متسوقة بحسب المرحلة التي $ë‏ بها في حملها. 





إذا نظرت إلى هذه الممارسة من منظور قانوني؛ فستستنتج أن Target‏ م تستخدم 
gi‏ معلومات تنتهك خصوصية العميل؛ إنهم فقط استخدموا بيانات المعاملات التي 
تقوم S‏ سلسلة تجارة التجزئة الأخرى تقريبًا بجمعها وتخزينها (ورها تحليلها) حول 
عملائها. ولكن ما كان مزعجًا في هذا السيناريو رها كان المفهوم المستهدف: الحمل. 
فهناك بعض الأحداث أو المفاهيم يجب أن تكون غير قابلة للتداول أو أن يتم التعامل 
معها بحذر شديد مثل: أمراض الشيخوخةء والطلاق. والإفلاس. 


أسئلة للمناقشة: 





-١‏ ما رأيك في التنقيب في البيانات وتأثيرها على الخصوصية؟ وما هي العتبة 
الفاصلة بين اكتشاف المعرفة وانتهاك الخصوصية؟ 

-Y‏ هل أخطأت Target‏ هل فعلت GÍ‏ شيء غير قانوني؟ blo‏ ما الذي كان يجب أن 
تفعله STarget‏ وهل يجب على Target‏ الإقلاع عن هذه الأنواع من الممارسات مستقبلًا؟ 
Sources: Hill, K. (2012, February 16). How Target figured out a teen girl was pregnant‏ 


before her father did. Forbes; Nolan, R. (2012, February 21). Behind the cover story: 


How much does Target know? NYTimes.com. 

خرافات وأخطاء فادحة حول التنقيب في البيانات: 
sd‏ التنقيبٌ في البيانات أداةً albos‏ قوية GS‏ المديرين التنفيذيين من التقدِّم في وصف 
طبيعة الماضي (بالنظر إلى مرآة الرؤية الخلفية) للتنبؤ بالمستقبل (النظر إلى الأمام) لإدارة عملياتهم 
التجارية بشكل أفضل (اتخاذ قرارات دقيقة وفي الوقت المناسب). تساعد عملية التنقيب في 
البيانات جهات التسويق في العثور على أنماط تفصح عن أسرار dsl o glas‏ العملاء. يكن 
استخدام نتائج التنقيب في البيانات لزيادة الإيرادات وخفض التكلفة من خلال تحديد الاحتيال 
واكتشاف الفرص التجارية؛ مما يوفر مناخًا جديدًا تمامًا وجيدًا للمَيْزة التنافسية. وكحقل متطور 
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qualis‏ يرتبط التنقيب في البيانات غالبًا بعدد من الخرافات» والتي يعرض الجدول Lás ٠-٤‏ منها 


.(Delen, 2014; Zaima, 2003) 


جدول T-t‏ خرافات التنقيب في البيانات 





الواقع 


الخرافة 





A35‏ عملية التنقيب في البيانات عمليةٌ متعددة الخطوات 
تتطلب تصميمًا واستخدامًا متعمدًا واستباقيًا. 


يوفر التنقيب في البيانات تنبؤات تشبه كرة 
بلورية فورية. 





الحالة الحالية للتنقيب في البيانات جاهزةٌ للاستعمال 
تقريبًا gY‏ نوع أو حجم عمل. 


التنقيب في البيانات غير قابل للتطبيق مع 
تطبيقات الأعمال السائدة. 





ox 


بسبب edil‏ في تقنية قاعدة البيانات؛ Y‏ يلزم 3579 
قاعدة Colo‏ مخصصة. 

ÉE‏ الأدوات الحديثة القائمة على الويب المديرين من جميع 
المستويات التعليمية من القيام بعملية التنقيب في البيانات. 


يتطلب التنقيبٌُ في البيانات قاعدة بيانات 
يمكن فقط للأشخاص ذوي الدرجات العلمية 
المتقدّمة القيام بالتنقيب في البيانات. 





إذا كانت البيانات تعكس بدقة الأعمال أو عملائهاء هكن 


التنقيب في البيانات هو فقط للشركات 


GY‏ شركة استخدام التنقيب في البيانات. 











الكبيرة التي لديها الكثير من بيانات العملاء. 





لقد اكتسب مناصرو التنقيب في البيانات ÉSSE‏ تنافسيةً lilo‏ من خلال فهم SÍ‏ هذه الخرافات 
هي مجرد: خرافات. وعلى الرغم من أن قيمة الاقتراح وبالتالي ضرورة وجودها واضحة GY‏ شخص؛ 
فإن أولئك الذين ينفذون مشاريع التنقيب في البيانات سواءً المبتدئ أو عاط البيانات المتمرس 
يرتكبون أخطاءً أحيانًا تؤدي إلى مشاريع ذات نتائج أقل من المرغوب فيها. ونعرض فيما يلي ٠١‏ 
من الأخطاء الشائعة في التنقيب في البيانات» ويجب أن يكون elole‏ البيانات على دراية بها. «Ades‏ 
يتحتم عليهم بذل قصارى جهدهم لتجنبها Nesbit‏ وآخرون 2001 Shultz, 2004; Skalak,‏ 2009: 
-١‏ اختيار مشكلة خطأ للتنقيب في البيانات: فلا هكن حل US‏ مشكلة تجارية بالتنقيب في 
البيانات sl)‏ متلازمة الطلقة السحرية). وعندما لا توجد بيانات تمثيلية (كبيرة وغنية 
بالميزات)» فلا كن أن يكون هناك مشروع استخراج بيانات عملي. 
-Y‏ تجاهل مايعتقده الداعمون في ما يمكن فعله وما لا هكن فعله باستخدام التنقيب في البيانات: 
فإدارة التوقعات هي مفتاح نجاح مشاريع التنقيب في البيانات. 
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التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 


-Y‏ البدء دون وَضْع تصؤر للنهاية: على الرغم من أن التنقيب في البيانات هو عملية اكتشاف 
للمعرفة؛ فإنه يجب أن يكون لدى المستخدم هدفٌ (مشكلة أعمال محددة) في ذهنه للنجاح. 
«oV‏ وكما يقول المثل: «إذا كنت لا تعرف إلى أين cal‏ ذاهب؛ فلن تصل إلى هناك «Mul‏ 

-E‏ تحديد المشروع الذي لا تدعمه بياناتك: Xa‏ التنقيب في البيانات هو JS‏ شيء عن البيانات؛ بمعنى 
أن القيد الأكبر لديك في مشروع التنقيب ف البيانات هو 21 البيانات. فمعرفة حدود البيانات 
تساعدك على صياغة مشاريع قابلة للتطبيق وتحقق النتائج ا مرجوة منها وتفي بالتوقعات. 

0- تحديد وقتٍ غير كاف لإعداد البيانات: إذ يتطلّب التجهيرٌ مجه ودا أكبر من المتوقع UE‏ 
حيث تشي المعرفة الشائعة إلى أن ما يصل إلى ثلث إجمالي وقت المشروع يتم استهلاكه على 
مهام جمع البيانات» وفهمهاء وتجهيزها. ولتحقيق النجاح؛ cios‏ البدء في النمذجة قبل أن 
تتم معالجة بياناتك بشكل صحيح (بحيث تكون متكاملة ومُنظّفة ومُحَوّلة). 

-١‏ النظر فقط في النتائج المجمّعة وليس في السجلات الفردية: يكون التنقيب في البيانات في 

أفضل حالاته عندما يتم تمثيل البيانات بشكل دقيق. حاول celos‏ تجميع البيانات وتبسيطها 

بشكل لا داعي له لمساعدة خوارزميات التنقيب في البيانات؛ فهي لا تحتاج إلى مساعدتك 

١ فلديها قدرة فائقة على فعل كل ذلك بنفسها.‎ io 

الوقوع في فم ads‏ إجراءات ونتائج التنقيب: ولأنها عمليةٌ اكتشاف تنطوي على العديد من 

التكرارات والتجارب؛ فمن المرجّح أن تفقد مسار النتائج. يتطلب النجاح تخطيطًا ممنهجًا 

ومنظمًا وتنفيذًا iis‏ / تسجيلًا لجميع مهام التنقيب في البيانات. 

-A‏ استخدام بيانات مستقبلية للتنبؤ بالمستقبل: بسبب عدم وجود وصف وفهم للبيانات» في كثير 
من الأحيان يقوم glih‏ البيانات بتضمين متغيرات غير معروفة في الوقت الذي من ا مفترض 
أن يتم التنبؤ فيه. ومن خلال القيام بذلك؟ تنتج نماذج التنبؤ الخاصة بها نتائج دقيقة لا يمكن 
تصديقها (وهي ظاهرة يُطلق عليها غالبًا «ذهب الأغبياء»). وإذا كانت نتائج التنبؤ الخاصة 
بك جيدة جدًا لدرجة يصعب تصديقها؛ فإنها ale‏ ما تكون UIS‏ وفي هذه الحالةء فإن أول 
شي تحتاج للبحث عنه هو الاستخدام غير الصحيح لمتغير من المستقبل. 

-I‏ تجاهل النتائج المشبوهة وانتقل بعيدًا عنها بسرعة: غالبًا ما تكون النتائج غير المتوقعة هي 
مؤشرات المستجدات الحقيقية في مشاريع التنقيب في البيانات. ويمكن أن يؤدي التحقيق 
السليم في مثل هذه النتائج الشاذة إلى اكتشافات مثيرة للدهشة. 

-٠‏ البدء بمشروع مجمع رفيع المستوى من شأنه أن يجعلك o‏ فوق العادةٌ: غالبًا 

ما تفشل مشاريع التنقيب في البيانات إذا مم يتم التفكير فيها بعناية من البداية إلى النهاية. 


0 
< 
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Lla‏ ما يني النجاح pi An‏ منتظم ومنظم للمشاريع من الصغيرة / البسيطة إلى 
الكبيرة / المعقدة. ويجب أن يكون الهدف هو إظهار القيمة المضافة التدريجية والمستمرة. 
بدلا من الدخول في مشروع كبير يستهلك الموارد دون إنتاج (Sl‏ نتائج ذات قيمة. 


-١‏ تشغيل خوارزميات التنقيب في البيانات بشكل متكرّر وأعمى: على الرغم من أن أدوات 


التنقيب في البيانات اليوم قادرةٌ على استهلاك البيانات وإعداد معلمات خوارزمية لتحقيق 
نتائج؛ فإنه ينبغي لمستخدم البيانات معرفة LAS‏ تحويل البيانات وتعيين قيم المعلمات 
المناسبة للحصول على أفضل النتائج الممكنة. فلكلٌ خوارزمية طريقةٌ فريدةٌ خاصةٌ بها معالجة 
البيانات» ومعرفة ما هو ضروري للحصول على أقصى استفادة من US‏ نوع من أنواع النماذج. 


- تجاهل خبراء الموضوع: يتطلّب فهم نطاق المشكلة والبيانات ذات ALAJI‏ تعاونًا شديدًا 


بين التنقيب في البيانات وخبراء المجال. فالعمل الجماعي يساعد خبير التنقيب في البيانات 
على تجاوز التمثيل النحوي والحصول أيضًا على الطبيعة الدلالية (أيْ: المعنى الحقيقي 
للمتغيرات) للبيانات. 


- تصديق JS‏ ما قيل لك عن البيانات: على الرغم من ضرورة Diall‏ إلى خبراء ا مجال لفهم 


البيانات ومشكلة العمل بشكل أفضل؛ [B‏ عام البيانات يجب ألا يأخذ i‏ شيء على أنه 
el aa 5al‏ به. إن الفاعلية والتحقق من خلال التحليل النقدي هما مفتاح الفهم الحميم 
للبيانات ومعالجتها. 

افتراض أن حُماة البيانات سيتواجدون Jal JS às‏ للتعاون في il‏ وقت calli‏ منهم ذلك: 
تفشل العديدٌ من مشاريع التنقيب في البيانات؛ لأن خبير التنقيب في البيانات لا يعرف/ 
لا يفهم السياسات التنظيمية. قد يكون أحد أكبر العقبات في مشاريع التنقيب في البيانات هم 
الأشخاص الذين يملكون البيانات ويسيطرون عليها. إن فهم وإدارة السياسة هو مفتاح تحديد 
البيانات والوصول إليهاء وفهمها بشكلٍ صحيح لإنتاج مشروع ناجح للتنقيب في البيانات. 
اختلاف معيار قياس النتائج بين المحلل وصاحب البيانات: يجب أن توجّه النتائج إلى 
المستخدم النهائي (المدير / gilo‏ القرار) الذي سيس تخدمها. وبالتالي؛ فإن تقديم النتائج 
في مقياس Sig‏ يجذب المستخدم النهاتي يزيد بشكل كبير من احتمالية الفهم الحقيقي 
والاستخدام السليم لنتائج التنقيب في البيانات. 

إذا قمت ببنائه؛ فسيأق: لا تقلق بشأن كيفية تقدهه: ale‏ يعتقد خبراء التنقيب في 
البيانات أنها تتم بمجرد إنشاء نماذج جيدة تلبّي وتزيد على احتياجات / متطلبات / توقعات 
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التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


المستخدم النهائي sil)‏ العميل). وبدون انتشار جيد؛ تكون القيمة المُحدّدة لنتائج التنقيب 
في البيانات محدودةً Ég‏ ما. لذلك؛ da‏ الانتش ار bal Soho‏ ضروريةً في عملية التنقيب 
في البيانات؛ إذ يتم qas‏ النماذج في البنية التحتية لدعم القرار التنظيمي؛ من أجل تمكين 
عملية اتخاذ القرار بشكلٍ أفضل وأسرع. 


أسئلة مراجعة على القسم iV-‏ 

-١‏ ما هي مشكلات الخصوصية في التنقيب في البيانات؟ 

-Y‏ كيف تعتقد أن يتحسّن النقاش بين الخصوصية والتنقيب في البيانات؟ وماذا؟ 

-Y‏ ما هي ST‏ الخرافات شيوعًا حول التنقيب في البيانات؟ 

£- ما رأيك في أسباب هذه الخرافات حول التنقيب في البيانات؟ 

0- ما هي الأخطاء الأكثر شيوعًا في التنقيب في البيانات؟ وكيف هكن تخفيفها أو القضاء عليها تمامًا؟ 


تلخيص eM‏ نقاط الفصل: 

ig -‏ التنقيبٌ في البيانات iae‏ لاكتشاف المعرفة الجديدة من قواعد البيانات. 

OS -‏ أن يستخدم التنقيب في البيانات ملفات مسطحة بسيطة كمصادر بيانات أو هكن تنفيذها 
على بيانات في مستودعات البيانات. 

- هناك العديدُ من الأسماء والتعريفات البديلة للتنقيب في البيانات. 

- يتواجد التنقيب ف البيانات في تقاطع العديد من التخصصات. ما في ذلك الإحصاء والذكاء 
الاصطناعي والنمذجة الرياضية. 

- تستخدم الشركات التنقيب في البيانات؛ لفهم عملائها بشكل أفضل وتحسين عملياتها. 

- يمكن العثور على تطبيقات التنقيب في البيانات في S‏ مجال من مجالات الأعمال والحكومة: Le‏ 
في ذلك الرعاية الصحية وامالية والتسويق والأمن الداخلي. 

d x3 -‏ كل من التنبؤ (التصنيف أو الانحدار)» والتجميع والترابط ثلاث فئاتِ واسعة من مهام 
التنقيب في البيانات. 

- مثل مبادرات التعزيز المؤسسي الأخرى؛ يجب أن يتبع مشروع استخراج البيانات عملية منهجية 
لإدارة المشاريع لتكون ناجحة. 
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gll الفصل‎ 


- تم اقتراحُ العديد من عمليات التنقيب في البيانات: KDDs SEMMA CRISP-DM‏ وما إلى ذلك. 

ái b CRISP-DM $s‏ منتظمةً ومنظمةً لإجراء مشاريع التنقيب في البيانات. 

- تستهلك الخطوات السابقة في مشاريع التنقيب في البيانات ssl)‏ فهم المجال والبيانات ذات 
(iLa‏ معظم الوقت الإجمالي للمشروع (غالبًا ما يزيد عن <۸٠‏ من الوقت الإجمالي). 

à id -‏ المعالجة AUSSI‏ للبيانات Bel‏ ضروريًا GY‏ دراسة ناجحة للتنقيب في البيانات؛ إذ تؤدي 
البيانات الجيدة إلى معلومات ase‏ وا معلومات الجيدة تؤدي إل قزارات ١ dag‏ 

- تنضمّن معالجة البيانات AJSSI‏ أربع خطوات رئيسة: دَمْج البيانات» وتنظيف البيانات» وتحويل 
البيانات» وتقليل حجم البيانات. 

gles -‏ مناهج التصنيف من الأمثلة السابقة التي تحتوي على مدخلات وعلامات الفئات الناتجة 
وبمجرد أن يتم تدريبهم بشكلٍ صحيح؛ يكونون قادرين على تصنيف الحالات المستقبلية. 

- يتم تجميعٌ سجلات hë‏ الأقسام إلى شرائح أو مجموعات طبيعية؛ بحيث يتشابه أعضاء كل 

شريحة في خصائص معينة. 

en‏ استخدام عدد من الخوارزميات المختلفة بشكلٍ شائع بغرض التصنيف. وتشمل التطبيقات 

.SPRINT5 .CHAIDs CART «C55 .C4.55 123 التجارية‎ 

تقوم أشجار القرار بتقسيم البيانات عن طريق gSA‏ عبر سمات مختلفة؛ بحيث يكون JS]‏ 

مجموعة أوراق نمط فئوي مشترك. 

As‏ مؤشر Gini‏ والحصول على ا معلومات (الانتروبيا)؛ طريقتين شائعتين لتحديد خيارات التفرّع 

في شجرة القرار. 

- يقيس مؤشْرٌ Gini‏ نقاء العينة. فإذا كان US‏ شيء في عينة ينتمي إلى فئة واحدة تكون قيمة 
مؤشر Gini‏ صفر. 

- تستطيع Bae‏ تقنيات تقييم أن تقيس دقة التنبؤ لنماذج التصنيف» ها في ذلك التقسيم البسيط 
التحقق المتقاطع K-fold. bootstrapping‏ والمساحة تحت منحنى ROC‏ 

- يتم استخدام خوارزميات التجميع عندما لا تحتوي سجلات البيانات على معرّفات فئة معرفة 

مسبقًا (معنىء لا يعرف إلى الفئة التي ينتمي إليها سجل معين). 

تحسب خوارزميات التجميع مقاييس التشابه؛ من أجل تجميع حالات مماثلة في مجموعات. 

dad -‏ قياس المسافة هو مقياس التشابه الأكثر استخدامًا في التحليل التجميعي. 

(S 3& -‏ من K-means‏ والخرائط ذاتية التنظيم؛ هما أكثر خوارزميات التجميع شيوعًا. 
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- يُستخدّم التنقيب في قواعد الارتباط؛ لاكتشاف اثنين أو أكثر من العناصر sl)‏ الأحداث 
أو المفاهيم) التي تذهب معاً. 

ole jus -‏ إلى التنقيب في قواعد الارتباط مصطلح تحليل ilu‏ السوق. 

o] -‏ خوارزمية الارتباط الأكثر استخدامًا هي sApriori‏ إذ يتم تحديد العناصر المتكرّرة من خلال 
اتباع نهج gaela‏ (من أسفل إلى أعلى). 

- يتم تقييم قواعد الارتباط Fly‏ على مقاييس ecl‏ والثقة المتعلقَيْن بها. 

jg -‏ العديد من أدوات التنقيب في البيانات سواء كانت مجانية أو بمقابل مادي. 

- إن أدوات التنقيب في البيانات ol‏ الأكثر شعبية هي .SAS Enterprise Minerg.SPSSPASW‏ 


- إن أشهر أدوات التنقيب في البيانات المجانية هي -RapidMiners Weka‏ 



































مصطلحات أساسية: 
خوارزمية Apriori‏ | شجرة القرار peso ^a‏ تنبۇ 
البطقة pines‏ قياس المسافة مصعد RapidMiner‏ 
ROC‏ 
ارتباط طاقم تحليل الارتباط slasi‏ 
SEMMA Microsoft Enterprise los 53] Bootstrapping‏ 
بيانات تسلسلية مؤشر Gini‏ التحالف تسلسل التنقيب 
تصنيف كسب اللمعلومات خادم مايكروسوفت SQL‏ التقسيم البسيط 
تجمع بيانات فاصلة بيانات اسمية الدعم 
الثقة التحقق ب س / جزء بيانات رقمية Weka‏ 
KNIME CRISP-DM‏ بيانات ترتيبية التنقيب في البيانات 
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gll الفصل‎ 


أسئلة للمناقشة: 

-١‏ عرف التنقيب في البيانات. لماذا هناك العديدٌ من الأسماء والتعريفات للتنقيب في البيانات؟ 

-Y‏ ما هي الأسباب الرئيسة وراء الرّواجٍ الحديث للتنقيب في البيانات؟ 

*- ناقش ما يجب على المنظمة مراعاته قبل اتخاذ قرارٍ بشراء برنامج التنقيب في البيانات. 

€- قارن بين التنقيب في البيانات والأدوات والتقنيات التحليلية الأخرى. 

0- ناقش طرق التنقيب في البيانات الرئيسة. وما هي الاختلافات الأساسية فيما بينها؟ 

-I‏ ما هي مجالات التطبيق الرئيسة للتنقيب في البيانات؟ ناقش القواسم المشتركة لهذه المجالات 
التي تجعلها فرصةً لدراسات التنقيب في البيانات. 

1U -V‏ نحتاج إلى عملية Bassa‏ للتنقيب في البيانات؟ وما هي عمليات التنقيب في البيانات الأكثر شيوعًا؟ 

-A‏ ناقش الاختلافات بين عمليتَيْ التنقيب في البيانات الأكثر استخدامًا. 

-A‏ هل A35‏ عمليات التنقيب في البيانات مجرد مجموعة متسلسلة من الأنشطة؟ اشرح إجابتك. 

BU -Y+‏ نحتاج إلى المعالجة المسبقة للبيانات؟ وما هي ell‏ الرئيسة والتقنيات ذات الصلة 

الممُستَخدّمة في المعالجة المسبقة للبيانات؟ 

-١‏ ناقش الأسباب الكامنة وراء تقييم نماذج التصنيف. 

-AY‏ ما هو الفرق الرئيس بين التصنيف والتجميع؟ اشرح إجابتك باستخدام أمثلة من الواقع. 

-١‏ بالانتقال إلى ما بعد مناقشة هذا الفصلء أين يمكن استخدام الارتباط؟ 

-٤‏ ما هي مشكلات الخصوصية في التنقيب في البيانات؟ هل تعتقد أنها موثقة؟ 

10- ما هي الخرافات المتداولة والأخطاء الأكثر شيوعًا حول التنقيب في البيانات؟ 








تمارين: شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 
-Y‏ قم بزيارة NO Aeradatauniversitynetwork.com‏ دراسات الحالة والأوراق البيضاء حول التنقيب 
في البيانات. وقم بوصف التطورات الحديثة في مجال التنقيب في البيانات والنمذجة التنبؤية. 


-Y‏ انتقل إلى >å .teradatauniversitynetwork.com‏ موقع ندوات الويب المتعلقة بالتنقيب 
في البيانات. على وجه yogadi‏ 235 موقع حلقة دراسية قدّمها JS‏ من C. Imhoff‏ 
Zougess‏ :1. شاهد ندوة الويب. ثم أجب عن الأسئلة التالية: 
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التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 


-١‏ اذكر بعض تطبيقات التنقيب في البيانات المثيرة للاهتمام؟ 

-Y‏ ما هي أنواع المكاسب والتكاليف التي هكن أن تتوقعها المنظمات من مبادرات التنقيب في البيانات؟ 

XH بالنسبة لهذا التمرين» يتمثل هدفك في بناء نموذج لتحديد المدخلات أو المتنبئات التي‎ -Y 
العملاء المحفوفين بالمخاطر من الآخرين (بناءً على الأنماط المتعلقة بالعملاء السابقين) ثم‎ 
هذه العينة نموذجيةٌ‎ i5 استخدام هذه المدخلات للتنبق بعملاء جدد محفوفين بالمخاطر.‎ 
Online W4.1 لهذا المجال. وبيانات النموذج المراد استخدامه في هذا التمرين هي في ملف‎ 
حالة و10 متغيرًا متعلقًا بالعملاء‎ EYO تتضمّن مجموعة البيانات‎ .CreditRisk.xlsx في ملف‎ 
السابقين والحاليين الذين اقترضوا من أحد البنوك لأسباب مختلفة. كما تحتوي على معلومات‎ 
وسبب القرضء والتوظيفء وا معلومات الدهوغرافية‎ JUI متعلقة بالعميل مثل الوضع‎ 
والنتيجة أو المتغير التابع للمركز الائتماني مع تصنيف كل حالة على أنها جيدة أو سيئة,‎ 
من الحالات كحالات تدريب وقم بتخصيص‎ ٠٠١ A على تجربة المؤسسة السابقة.‎ tL 
حالة أخرى للاختبار. قم ببناء نموذج شجرة قرارات لمعرفة خصائص المشكلة. اختبر أداء‎ Yo 
حالة أخرى. ثم قم بإعداد تقريرين» أحدهما عن أداء التعلم والاختبار‎ Yo هذا النموذج على‎ 
في نموذجك. والآخر لتحديد نموذج شجرة القرار ومعلمات التدريب بالإضافة إلى الأداء‎ 
This exercise) برنامج لشجرة القرارات.‎ (Sl الناتج في مجموعة الاختبار. يمكنك استخدام‎ 
is courtesyof StatSoft, Inc., based on a German data set from ftp.ics.uc;i.edu/ 
يهدف هذا التمرين إلى تعريفك بتعدين القاعدة.‎ / pub/machine-learning-databases 
-(statlog/german renamed CreditRisk and altered 

-E‏ بالنسبة لهذا التمرينء ستقوم بتكرار de)‏ نطاق أصغر) نمذجة شبك التذاكر الموضّح في 
الحالة العملية N-E‏ قم بتنزيل مجموعة بيانات التدريب من jS‏ من «Online File W4.2‏ 
«MovieTrain.xlsxs‏ وهي بتنسيق Microsoft Excel‏ استخدم وصف البيانات الموضّح à‏ 
الحالة العملية 7-6 لفهم ا مجال والمشكلة التي تحاول حلها. قم بانتقاء واختيار المتغيرات 
المستقلة الخاصة بك. قم بتطوير ثلاثة نماذج تصنيف على الأقل (على سبيل «JULI‏ شجرة 
القرارات» الانحدار اللوجستيء الشبكات العصبية). قارن نتائج الدقة باستخدام تقنيات 
cross-validation‏ 10-1011 والتقسيم المئوي واستخدم كذلك مصفوفات الدقة ثم علق 
على النتيجة. اختبر النماذج التي قمت بتطويرها على مجموعة الاختبار (انظر ملف الإنترنت 
.(W4.3, MovieTest.xlsx‏ قم بتحليل النتائج بنماذج مختلفة. مع وضع أفضل نموذج 
تصنيف» ودعمه مع نتائجك. 
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الفصل الرابع 


0- يهدف هذا التمرين إلى تقديمك إلى التنقيب في قواعد الارتباط. تحتوي مجموعة بيانات 
Excel basketsIntrans.xlsx‏ على ۲۸۰۰ ملاحظة / سجل لبيانات منتجات السوبر ماركت. 
يحتوي كل سجل على بطاقات تعريف للعملاء والمنتجات التي قاموا بشرائها. استخدم 
مجموعة البيانات هذه لفهم العلاقات بين المنتجات (أيْ: المنتجات التي يتم شراؤها «(lta‏ 
ابحث عن العلاقات المثيرة وأضف لقطات شاشة SS‏ أنماط ارتباط خفية قد تجدها. وبشكلٍ 
أكثر تحديدًاء أجب عن الأسئلة التالية: f‏ 
-١‏ ما هي قواعد الارتباط التي تعتقد أنها الأكثر أهمية؟ 

-Y‏ استنادًا إلى بعض قواعد الارتباط التي وجدتهاء قم بإجراء ثلاث توصيات أعمال على الأقل 
قد تكون مفيدة للشركة. قد تتضمّن هذه التوصيات أفكارًا حول تنظيم الرّف أو بيع 
المنتجات. (سيتمٌ pda‏ نقاط مكافأة للأفكار الجديدة / المبتكرة). 

-Y‏ ما هي قيم osil‏ والثقة والرفع للقاعدة التالية؟ 

Wine, Canned Veg — Frozen Meal 
sKNIME (knime.org) ستستخدم أداة تعدين البيانات المجانية / مفتوحة المصدر‎ iagh! في هذه‎ -1 
وذلك لإنشاء نماذج تنبؤية لمجموعة بيانات تحليل حركات العملاء الصغيرة نسبيًا. يجب‎ 
عليك تحليل مجموعة البيانات المعطاة (حول سلوك استبقاء / تسرب العميل لعينة مكونة‎ 
عميل) بغرض تطوير ومقارنة ما لا يقل عن ثلاثة نماذج للتنبؤ (أيْ: للتصنيف).‎ ٠٠٠١ من‎ 
يمكنك تضمين مقارنتك على أشجار القرار والشبكات العصبية وآلة المتجهات‎ JEL فعلى سبيل‎ 
الداعمة والجار الأقرب و / أو نماذج الانحدار اللوجستي. فيما يلي تفاصيل هذه المهمة:‎ 
.(knime.org) من‎ KNIME تثبيت واستخدام أداة برنامج‎ - 
لتجهيز البيانات مسبقًا (حسب حاجتك / رغبتك).‎ MS Excel يمكنك أيضًا استخدام‎ - 
من موقع الكتاب على الويب.‎ CustomerChurnData.csv قم بتنزيل ملف البيانات‎ - 
(قيم مفصولة بفواصل). وهذا التنسيق هو تنسيق‎ CSV البيانات بتنسيق‎ clas) يتم‎ - 
الملفات المس طّحة الأكثر شيوعًا والذي يكن للعديد من أدوات البرنامج فتحه / التعامل‎ 
(MS Excelg KNIME معه بسهولة )ما في ذلك‎ 

- اعرض نتائجك في مستند احترافي منظم جيدًا. 

- اعرض على صفحة الغلاف معلومات مناسبة عنك وعن المهمة. 
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التحليلات التنبؤية (1): dlas‏ وطرق» وخوارزميات التنقيب في البيانات 


a SG -‏ من تكامل الأرقام (المخططات البيانية الرسوم البيانية. الجداولء لقطات الشاشة) 
بشكلٍ رائع في الصف gal‏ بطريقة احترافية. كما يجب أن يحتوي التقرير على ستة 
أقسام رئيسية (تشبه مراحل CRISP-DM‏ 

- حاول ألا تتجاوز ١١‏ صفحة في الإجماليء ما في ذلك الغلاف (استخدم الخط 
MY ez Times New Roman‏ وتباعد الأسطر (V0‏ 


Algo‏ الفريق ومشروعات لعب الأدوار: 

-١‏ قم بفحص كيفية قيام أجهزة التقاط البيانات الجديدة, مثل علامات RFID‏ بمساعدة 
المؤسسات على تحديد عملائها بدقة وتقسيمهم إلى أنشطةء مثل التسويق المستهدّف. تنطوي 
العديدٌُ من هذه التطبيقات على التنقيب في البيانات. قم بإدخال المطبوعات والويب إلى 
الشاشة باستخدام ا ماسح الضوني (scanner)‏ ثم قم باقتراح خمسة تطبيقات محتملة جديدة 
للتنقيب في البيانات يمكنها استخدام البيانات التي تم إنشاؤها باستخدام تقنية RFID‏ 
ما هي القضايا التي يمكن أن تنشأ إذا كانت قوانين البلد تتطلب تضمين هذه الأجهزة في جسم 
كل شخص لنظام تحديد الهوية الوطني؟ 

-Y‏ قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في مؤسستك؛ لتحديد كيف oS‏ أن 
يساعدهم التنقيب في البيانات ومستودعات البيانات وأدوات OLAP‏ وأدوات التصوير في 
عملهم. اكتب اقتراحًا يَصف نتائجك. ثم قم بإعداد تقرير يتضمّن تقديرات التكلفة والفوائد. 

-Y‏ يتوفر مستودع جيد جدًا للبيانات التي تم استخدامها لاختبار elof‏ العديد من خوارزميات 
التنقيب في البيانات في .ics.uci.edu/mlearn/MLRepository.html‏ تهدف بعض مجموعات 
البيانات إلى اختبار حدود الخوارزميات الحديثة لتعلّم AYI‏ وكذلك تهدف إلى مقارنة أدائها 
مع الأساليب الجديدة للتعلم. ومع ذلك؛ قد تكون بعض مجموعات البيانات الأصغر مفيدةٌ في 
استكشاف وظائف il‏ برنامج من برامج التنقيب في البيانات, مثل .KNIME si Rapid Miner‏ 
قم بتنزيل مجموعة بيانات واحدة على الأقل من هذا المستودع (ولتكنء قواعد بيانات فحص 
الائتمان أو قاعدة بيانات الإسكان) وتطبيق أساليب شجرة القرار أو طرق التجميع حسب 
الاقتضاء. قم بإعداد تقرير بناءً على نتائجك. (يمكن استخدام بعض هذه التمارين» do‏ تلك 
التي تنطوي على بيانات كبيرة أو مشكلات صعبة كمشاريع على المدى الطويل). 

-E‏ يتم توفير مجموعات بيانات كبيرة وغنية obzlb‏ من قبل الحكومة الأمريكية أو الشركات 
التابعة لها على الإنترنت. فعلى سبيل المشال: يمكنك الاطلاع على مجموعة كبيرة من 
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الفصل الرابع 


مجموعات البيانات الحكومية (data.gov)‏ ومجموعات بيانات مراكز السيطرة على الأمراض 
والوقاية منها ASh blg (www.cdc.gov/DataStatistics)‏ ومجموعة البيانات الخاصة بعلم 
الأوبئة والنتائج النهائية الخاصة بشركة «Cancer.org (http://seer.cancer.gov/data)‏ 
ومجموعات بيانات نظام تقارير تحليلات معدل الوفيات التابع لوزارة النقل www.nhtsa.)‏ 
58 الاحظ أيصًا أنه لا يتم عمل معالجة مُسبّقة لهذه المجموعات من البيانات 
لأغراض التنقيب ف البيانات؛ مما يجعلها موردً! رائعًا لتجربة عملية التنقيب في البيانات 
بالكامل. يتم إدراج مصدر آخر غني لمجموعة من مجموعات بيانات التحليلات على موقع 
-KDnuggets.com (kdnuggets.com/datasets/index.html)‏ 


0- خذ بعين الاعتبار مجموعة البيانات التالية» والتي تتضمّن ثلاث سمات وتصنيقًا لقرارات 


القبول في برنامج ماجستير إدارة الأعمال: 

-١‏ باستخدام البيانات المعروضة في الجدول أدناه؛ قم بتطوير قواعد الخبرة اليدوية الخاصة 
بك لاتخاذ القرار. 

-Y‏ استخدم مؤشر Gini‏ لإنشاء شجرة قرار. يمكنك استخدام الحسابات اليدوية أو جدول 
البيانات أدناه لإجراء الحسابات الأساسية. 


-Y‏ استخدام goly‏ شجرة قرارات آلي لإنشاء شجرة لنفس البيانات. 



































M E. GMAT J النقاط الكمية‎ j 
(بالنسبة المئوية)‎ 

10. Vo Yo لا‎ 
0 Y,- v. لا‎ 
1 Yo vo نعم‎ 
£0. Yo A. لا‎ 
۷ Fo a. نعم‎ 
o4. Yo. 4 نعم‎ 
t. YAO £o لا‎ 
Te Yo. vo نعم‎ 
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التحليلات التنبؤية (1): dlas‏ وطرقء وخوارزميات التنقيب في البيانات 





النقاط الكمية ل GMAT‏ 
قرار GMAT GPA‏ 
(بالنسبة المنوية) 























ot. Ye Y. $ 
We A0 ^. $ 
3 ع‎ 10 0 





تمارين الإنترنت: 


-١‏ قم بزيارة AI Exploratorium‏ في .cs.ualberta.ca/aixplore‏ انقر على رابط شجرة 
القرارات. اقرأ السرد على إحصائيات لعبة كرة السّلة. افحص البيانات» ثم أنشئْ شجرة 
قرار. اكتب تقريرًا عن انطباعاتك عن دقة شجرة القرارات هذه. استكشف أيضًا تأثيرات 
الخوارزميات المختلفة. 

۲- قم باستقصاء بعض أدوات التنقيب في البيانات ومورّديها. ابدأ Js‏ من .egain.com  fico.com‏ 
قم بزيارة موقع dmreview.com‏ 2355 بعض منتجات التنقيب في البيانات ومقدّمي 
الخدمات غير المذكورة في هذا الفصل. 

-Y‏ ابحث عن حالات حديثة من تطبيقات التنقيب في البيانات الناجحة. قم بزيارة مواقع الويب 
لبعض مورّدي أدوات التنقيب في البيانات» وابحث عن حالات أو قصص نجاح. ثم قم بإعداد 
تقرير بعص خمس «راسات حالة جديدة. 

€- انتقل إلى مواقع الويب الخاصة بالبائعين (خاصةً SAS‏ و5255 و5وهمع00). «Teradata‏ 
(Fair Isaacs StatSoftg‏ واطلع على قصص النجاح الخاصة بأدوات ذكاء الأعمال 
OLAP)‏ والتنقيب في البيانات). ما الذي تشترك فيه قصص النجاح المختلفة؟ كيف تختلف؟ 





0- انتقل إلى statsoft.com‏ (وهي إحدى شركات Dell‏ الآن). قم بتنزيل ثلاث ورقات بيضاء 
على الأقل حول التطبيقات. gi‏ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / 
النصوص / الويب التي تمت مناقشتها في هذا الفصل؟ 

1- اذهب إلى sas.com‏ وقم بتنزيل ثلاث وثائق بيضاء على الأقل حول التطبيقات. أي من هذه التطبيقات 
رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي مت مناقشتها في هذا الفصل؟ 
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-V‏ انتقل إلى spss.com‏ (شركة (IBM‏ قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
Gi‏ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت 
مناقشتها في هذا الفصل؟ 

-A‏ انتقل إلى .teradata.com‏ قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي Cuz‏ مناقشتها 
في هذا الفصل؟ 

؟- انتقل إلى fico.com‏ قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. أي من هذه 
التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي ّت مناقشتها في 
هذا الفصل؟ 

-V+‏ انتقل إلى .salfordsystems.com‏ قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
(Sl‏ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي تت 
مناقشتها في هذا الفصل؟ 

-V‏ انتقل إلى .rulequest.com‏ قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
il‏ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي CA‏ 
مناقشتها في هذا الفصل؟ 

-VY‏ انتقل إلى kdnuggets.com‏ استكشف الأقسام على التطبيقات وكذلك البرامج. ابحث عن 
أسماء ثلاث حزم إضافية على الأقل للتنقيب في البيانات وتنقيح النصوص. 
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الفصل الخامس 
التحليلات التنبؤية (Y)‏ 
تحليلات النص والويب ووسائل التواصل الاجتماعي 


أهداف التعلم: 
- وصف تحليلات النصوص وفهم الحاجة إلى التنقيب في النص. 
- التمييز بين تحليلات النصوص, والتنقيب في النصء والتنقيب في البيانات. 
- فهم المجالات المتنوعة لتطبيق التنقيب في النص. 
- التعرف على عملية تنفيذ مشروع التنقيب في النص. 
- التعرف على الطرق المختلفة لهيكلة البيانات النصية. 
- وصف تحليل المشاعر. 
- رفع مستوى الإبمام بالتطبيقات الشائعة لتحليل المشاعر. 
- تعلم الطرق الشائعة لتحليل المشاعر. 
- التمرس على تحليلات الكلام كما ترتبط بتحليل المشاعر. 

يقدم هذا الفصل نظرةٌ شاملة على تحليلات / التنقيب في النصوص / الويب» بالإضافة إلى 
مجالات التطبيق الشائعة مثل محركات البحث وتحليل المشاعر وتحليلات الشبكات / وسائل 
التواصل الاجتماعي. وكما شهدنا في السنوات الأخيرة» فإن البيانات غير المهيكلة التي يتم إنشاؤها 
عبر الإنترنت (الويب» وشبكات الاستشعارء وأنظمة التعرف على ترددات الراديو [RFID]‏ 
وشبكات ASLA‏ إلخ) تزداد بسرعة هائلة وليس هناك مؤشر على تباطئها. pod‏ هذه الطبيعة 
المتغيرة للبيانات المنظمات على جعل تحليلات النص والويب جزءًا حساسًا من بنيتها التحتية فيما 
يخص ذكاء / تحليلات الأعمال. 


١-5‏ مقال افتتاحي: VY‏ مقابل الإنسان على :Jeopardy‏ قصة واتسون: 


هل تستطيع الآلة التغلب على أفضل ما في الإنسان فيما يفترض أن يكون الإنسان هو الأفضل 
فيه؟ يبدو أن الإجابة هي: نعم واسم الآلة هو واتسون. حيث يعتبر واتسون هو نظام حاسب 
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استثنائي (مزيج جديد من الأجهزة والبرامج المتقدمة) مصمم للإجابة على الأسئلة المطروحة 
باللغة البشرية الطبيعية. وقد تم تطويره في عام ۲۰۱۰ من قبل فريق IBM Research‏ كجزء 
من مشروع 004 واستمد اسمه من أول رئيس لشركة IBM‏ وهو "Thomas J. Watson‏ 


خلفىة: 


منذ la‏ يقرب من «Sls: as Y‏ كانت IBM Research‏ تبحث عن تحد ios‏ كبير لمجاراة 
الاهتمامات العلمية والشعبية ل Deep Blue‏ بطل لعبة الشطرنج على الحاسب. والذي قد 
يرت Ja‏ بعلاقة واضحة بالاهتمامات التجارية الخاصة بشركة IBM‏ كان الهدف هو تطوير علوم 
الحاسب من خلال استكشاف طرق جديدة لتقنية الحاسب تؤثر على العلوم والأعمال التجارية 
والمجتمع. وبناءً على ذلك قبلت Gaas IBM Research‏ ببناء نظام حاسب یکن أن ينافس على 
لقب بطل العالم بشكل فوري لبرنامج مسابقة التليفزيون الأمريكي Jeopardy‏ وقد شمل نطاق 
التحدي مشاركة متسابق آلي بشكل فوري للعرض التليفزيونيء ويكون لديه القدرة على الاستماع 
والفهم olas‏ وليس مجرد تمرين معملي. 
التنافس ضد الأفضل: 

في عام Y M‏ وكاختبار لقدراته» تنافس واتسون على مسابقة Jeopardy‏ في أول مباراة بين 
البشر والآلة. في مباراة ثنائية مجمعة النقاط (تم بثها عبر ثلاث حلقات من العرض التلفازي 
Jeopardy‏ في الفترة ۱٦-۱١‏ فبراير)ء jè‏ واتسون على Brad Rutter‏ أكبر رابح با مال على الإطلاق في 
Jeopardy‏ وعلى Ken Jennings‏ حامل الرقم القياسي لأطول فترة بالبطولة وهي Vo)‏ يومًا). في 
هذه الحلقات» استمر واتسون في التفوق على خصومه من البشر bs‏ لجهاز إشارات اللعبةء لكنه 
واجه صعوبة في الرد على بعض الفئات» خاصةً أولئك الذين لديهم أدلة قصيرة تحتوي فقط على بضع 
كلمات. استطاع واتسون الوصول إلى ٠٠١‏ مليون صفحة منظمة / غير منظمة المحتوى ومخزنة على 
€ تيرابايت من إجمالي السعة التخزينية للقرص. وم يكن واتسون متصلًا بالإنترنت خلال المباراة. 

أعلن أحد المختصين في «UJ‏ تلفازي عن Jeopardy‏ أن التحدي المطلوب هو التقدم ودمج 
مجموعة متنوعة من تقنيات ضمان الجودة (التنقيب في النصوص ومعالجة اللغات الطبيعية)» 
ها في ذلك التحليل اللفظيء وتصنيف الأسئلة وتحليله ا واقتناء المصادر بصورة تلقائية وتقييمهاء 
واكتشاف الكيان «xls‏ وتكوين النماذج المنطقية» وتمثيل المعرفة والتفكير. وأضاف أن الفوز 
في Jeopardy‏ يتطلب أن تتحلى إجاباتك بثقة في الحوسبة بصورة عالية الدقة. وفي الوقت الذي 
تكتسي فيه الأسئلة وا محتوى بالغموض والضجيج. ولا يتمتع أي من الخوارزميات الفردية بالكمال. 
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لذلك؛ يجب أن يقدم كل مكون مخرجاته بدرجة من الثقةء كما يجب تجميع درجات الثقة لكل 
المكونات الفردية للقيام بحساب الثقة الكلية للإجابة النهائية. ويتم استخدام الثقة النهائية 
لتحديد ما إذا كان ينبغي على نظام الحاسب المخاطرة باختيار الإجابة على أي حال. في لغة برنامج 
Jeopardy‏ تستخدم هذه الثقة لتحديد ما إذا كان الحاسب سوف يصدر Éo‏ أو "zb"‏ لسؤال 
ما. وهنا يجب أن يتم حساب الثقة خلال الوقت الذي تتم فيه قراءة السؤال وقبل فرصة صدور 
الرنين للسؤال. ويقدر هذا الوقت تقريبًا ما بين ثانية واحدة إلى 1 OS‏ بمتوسط olg Y‏ تقريبًا. 
كيف يفعل واتسون ذلك؟ 
إن نظام واتسونء والذي يدعى DeepQA‏ هو بنية حسابية متوازية وواسعة النطاق تركز 
على التنقيب في النصوصء وتستند إلى الأدلة الاحتمالية. وبالنسبة لتحدي Jeopardy‏ استخدم 
واتسون أكثر من ٠٠١‏ طريقة مختلفة لتحليل اللغة الطبيعيةء وتحديد المصادرء وإيجاد وتوليد 
فرضيات» وإيجاد الأدلة وإعطائها نقاطء ودمج وترتيب الفرضيات. وما هو أهم بكثير من أي 
تقنية تم استخدامها هو كيفية دمجهم في DeepQA‏ بحيث هكن للطرق المتداخلة أن تستحضر 
نقاط قوّتها للإنتاج والمساهمة في تحسين JS‏ من الدقة والثقة والسرعة. 
تعتبر DeepQA‏ بنية OIS‏ منهجية مصاحبةء وهي ليست خاصة بتحدي Jeopardy‏ وتشكل 
المبادئ الشاملة في DeepQA‏ توازيًا SOUS‏ وعديدًا من الخبراء وتقديرًا للثقة ا منتشرة وتكاملًا 
في تحليلات النص بصورة أحدث وأعظم. 
- التوازي الهائل: يفيد التوازي الهائل في النظر في تفسيرات وفرضيات متعددة. 
- العديد من الخبراء: يسهل التكامل والتطبيق والتقييم السياقي للمجموعة واسعة من تحليلات 
الأسئلة والمحتوى الاحتمالي المتباعدين عن بعضهما. 
- تقدير الثقة المنتشرة: لا يلتزم أي عنصر sb‏ إجابة؛ فجميع المكونات تنتج ميزات ومستوى الثقة 
المرتبطة بهاء وسجل تفسيرات مختلفة للأسئلة والمحتوى. حيث تقوم الركيزة الأساسية لمعالجة 
الثقة بالتعرف على كيفية تكديس النتائج ودمجها. 
- تكامل المعرفة السطحية والعميقة: ويتم ذلك عن طريق الموازنة في استخدام الدلالات الصارمة 
والسطحية: والاستفادة من العديد من التجميعات التي تكونت بشكل يتسم بالأريحية. 
يوضح الشكل )1-0( بنية عالية المستوى ل .DeepQA‏ ولمزيد من التفاصيل الفنية حول 
المكونات المختلفة odg)‏ البنية وأدوارها وقدراتها المحددة انظر: Ferrucci‏ وآخرين (Y-A)‏ 
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شكل :١-6‏ تصوير gle‏ المستوى لبنية DeepQA‏ 

استنتاج: 

ساعد تحدي Jeopardy‏ شركة IBM‏ في جمع المتطلبات التي cool‏ إلى تصميم بنية DeepQA‏ 
وتنفيذ برنامج واتسون. وبعد Y‏ سنوات من البحث والتطوير المكثف من قبل فريق أساسي 
يتكون تقريبًا من db ٠١‏ يعمل واتسون في العرض التلفازي ممسابقة Jeopardy‏ على مستويات 
عالية من الخبرة البشرية من حيث الدقة والثقة والسرعة. 

تزعم IBM‏ أنها طورت العديد من الخوارزميات الحسابية واللغوية لمعالجة أنواع مختلفة 
من القضايا والمتطلبات فيما يخص ضمان الجودة. وعلى الرغم من أن بواطن هذه الخوارزميات 
غير معروفة» إلا lil‏ حققت أقصى استفادة من تحليلات النص والتنقيب في النص. وتعمل شركة 
4 الآن على إصدار واتسون للتعامل مع المشكلات التي يمكن التغلب عليها في مجال الرعاية 
الصحية والطب Feldman)‏ وآخرونء (Y W‏ 
ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 

مما لا شك فيه أن تقنية الحاسب - سواء الأجهزة أو واجهات البرامج - تتقدم بشكل أسرع 
من أي شيء آخر في الخمسين سنة الماضية. إن الأشياء التي كانت كبيرة Ier‏ ومعقدة ier‏ ومن 
المستحيل حلهاء أصبحت OVI‏ في متناول تقنية المعلومات. وتعتبر تحليلات / التنقيب في النص 
إحدى التقنيات التمكينية المستخدة في ذلك. وقد تم إنشاء قواعد بيانات لتركيب البيانات 
بحيث هكن معالجتها بواسطة أجهزة الحاسب. من ناحية أخرىء كان المقصود بالنسبة للنص أن 
تتم معالجته بواسطة البشر. والسؤال الذي يطرح نفسه dus‏ هل هكن للآلات القيام بالأشياء 
التي تتطلب إبداع الإنسان وذكاءه. وهي مم تصمم أصلا للآلات؟ من الواضح أن الإجابة: نعم. 
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فيعتبر واتسون مثالا رائعًا على المسافة التي قطعناها في معالجة المستحيل. وقد أصبحت أجهزة 
الحاسب الآن ذكية ها يكفي للقيام بدور البشر فيما نعتقد أن البشر هم الأفضل في هذا المجال. 
إن فهم السؤال الذي تم طرحه في اللغة البشرية المنطوقة» ومعالجته وفهمه فهمًا dás‏ والبحث 
عن إجابة «d‏ والرد عليه في غضون ثوان قليلة كان E à‏ لم يكن بإمكاننا تصوره قبل أن يفعله 
واتسون Se‏ وفي هذا الفصلء ستتعلم الأدوات والتقنيات التي قام عليها واتسون والعديد من 
الأجهزة الذكية الأخرى والتي صنعت المعجزات من أجل معالجة المشاكل التي كان يُعتقد في يوم 
من الأيام أنه من المستحيل حلها. 
أسئلة مراجعة على المقالة الافتتاحية: 
1- ما هو واتسون؟ ما هو المميز فيه؟ 
-V‏ ما هي التقنيات المستخدمة في بناء واتسون (سواء من الأجهزة أو من البرامج)؟ 
A‏ ما هي الخصائص ال مبتكرة لبنية DeepQA‏ التي صنعت تفوق واتسون؟ 
9- اذا أنفقت IBM‏ كل هذا الوقت وامال «UJ‏ واتسون؟ أين عائد الاستثمار SRON)‏ 
Y-0‏ نظرة عامّة على تحليلات gal‏ والتنقيب في النص: 

يتميز عصر المعلومات الذي نعيش فيه بالنمو السريع في كمية البيانات والمعلومات التي 
يتم جمعها وتخزينها وإتاحتها في شكل إلكتروني. حيث يتم تخزين الغالبية العظمى من بيانات 
الأعمال في وثائق نصية غير منظمة فعليًا. ووفقًا لدراسة أحراها كل من Merrill Lynch‏ 
Gartners‏ فإن XAO‏ من جميع بيانات الشركة يتم التقاطها وتخزينها في شكل غير منظم 
(McKnight, 2005)‏ وقد ذكرت نفس الدراسة أيضًا أن هذه البيانات غير المنظمة يتضاعف 
حجمها كل VA‏ شهرًا. ونظرًا OS‏ المعرفة تمثل قوة في عام الأعمال اليوم» بالإضافة إلى أنها مستمدة 
من البيانات والمعلوماتء فإن الشركات التى تستفيد بكفاءة وبشكل فعال من مصادر البيانات 
النصية يكون لديها المعرفة اللازمة لاتخاذ قرارات أفضلء مما يجعلها تتميز في المنافسة عن تلك 
الشركات التي تتخلف عن الركب. وهذا تماما هو المكان الذي تتناسب فيه الحاجة إلى تحليلات 
النصوص والتنقيب في النص مع الصورة الكبيرة الحالية للأعمال التجارية. 

وعلى الرغم من أن الهدف الرئيس لكل من تحليلات النصوص والتنقيب في النص هو تحويل 
البيانات النصية غير المهيكلة إلى معلومات قابلة للتطبيق من خلال تطبيق معالجة اللغات الطبيعية 
(NLP)‏ والتحليلات» حيث إن تعريفاتها مختلفة بعض cs si]‏ على الأقل بالنسبة لبعض خبراء هذا 
المجال. ووفقًا لهؤلاء الخبراء O‏ مفهوم تحليلات النص هو مفهوم أوسع حيث يشمل استرجاع 
المعلومات (مثل البحث وتحديد الوثائق ذات الصلة لمجموعة معينة من المصطلحات الرئيسة)» 
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وكذلك استخراج المعلومات» والتنقيب في البيانات» والتنقيب في الويب» في حين يركز التنقيب في 
النص في المقام الأول على اكتشاف معرفة جديدة ومفيدة من مصادر البيانات النصية. ويوضح 
الشكل (Y-0)‏ العلاقات بين تحليلات النصوص والتنقيب في النص إلى جانب مناطق التطبيق الأخرى 
ذات الصلة. ويبين الجزء السغلي من الشكل (5-؟) التخصصات الرئيسة (أساس التصميم) التي 
تلعب دورًا حساسًا في تطوير مجالات التطبيق ASII‏ انتشارًا بشكل متزايد. flug‏ على هذا التعريف 
لتحليل النصوص, والتنقيب في «adl‏ فإنه يمكن ببساطة حساب الفرق بينهما كما يلي: 

تحليلات النص = استرجاع المعلومات + استخراج المعلومات + التنقيب في البيانات + التنقيب في الويب. 

أو ببساطة: تحليلات النص = استرجاع المعلومات + التنقيب في النص. 

















شكل :Y-0‏ تحليلات النص والتطبيقات ال مرتبطة والتخصصات التمكينية 


Sources: Ferrucci, D., Brown, E., Chu-Carroll, J., Fan, J., Gondek, D., Kalyanpur, A. A..... Welty, C. (2010). 
Building Watson: An overview of the DeepQA Project. AI Magazine, 31(3); DeepQA. DeepQA Project: 
FAQ, IBM Corporation (2011). research.ibm.com/deepqa/faq.shtml (accessed January 2013); Feldman, 
S., Hanover, J., Burghard, C., & Schubmehl, D. (2012). Unlocking the power of unstructured data. IBM 


white paper. www-01.ibm.com/software/ebusiness/jstart/downloads/unlockingUnstructuredData.pdf 
(accessed February 2013). 
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X xis‏ مصطلح تحليلات النصوص مصطاحًا جديدًا نسبيًا بالمقارنة مع مصطلح التنقيب في 
النص؛ إذ يركز مصطلح تحليلات النصوص على التحليلات» وكما هو الحال في العديد من مجالات 
تطبيقات التقنية الأخرى ذات الصلة (مثل تحليلات المستهلكء والتحليلات الكاملة. والتحليلات 
ds LU‏ والتحليلات الاجتماعية)» فإن مجال النص يحتاج أيضًا إلى الحصول على مُحاكاة للتحليلات. 
ues‏ الرغم من استخدام مصطلح تحليلات النصوص بشكل أكثر انتشارًا في سياق تطبيق الأعمالء 
إلا أن مصطلح التنقيب في النص يستخدم بشكل متكرر في دوائر البحث الأكاديمية. ورغم أنه 
في بعض الأحيان قد يتم تعريف مصطلحي (تحليلات النص والتنقيب في النص) بطريقة مختلفة 
بعض الشيء. إلا أنهما يستخدمان بشكل مترادف. 

التنقيب في النص (ويُعرف أيضًا باسم التنقيب في البيانات النصيةء أو اكتشاف المعرفة في قواعد 
البيانات النصية) هو عملية شبه آلية لاستخلاص الأنماط (المعلومات والمعرفة المفيدة) من كميات 
كبيرة من مصادر البيانات غير المهيكلة. والجدير بالذكر أن التنقيب في البيانات هو عملية تحديد 
أنماط صالحة ومبتكرة ومفيدة ومفهومة في بيانات مخزنة في قواعد البيانات المنظمةء حيث يتم 
تنظيم البيانات في سجلات منظمة من خلال متغيرات فئوية أو ترتيبية أو مستمرة. axis‏ التنقيب في 
yal‏ هو نفسه التنقيب في البيانات من حيث استهدافه لنفس الغرض واستخدامه لنفس العمليات» 
ولكن مع التنقيب في النص ينطوي الإدخال إلى العملية على مجموعة من ملفات البيانات غير 
المهيكلة (أو الأقل (Guas‏ مثل: وثائق Word‏ وملفات PDF‏ والمقتبسات النصية وملفات XML‏ 
وما إلى ذلك. ويمكن اعتبار التنقيب في النص في جوهره كعملية (ذات خطوتين رئيسيتين) تبدأ بفرض 
هيكلة مصادر البيانات المستندة إلى النص يتبعها استخلاص المعلومات والمعارف ذات الصلة من 
هذه البيانات المهيكلة والمستندة إلى النصء وذلك باستخدام تقنيات وأدوات التنقيب في البيانات. 

وتظهر فوائد التنقيب في النص بوضوح في المجالات التي يتم فيها توليد كميات كبيرة من 
البيانات النصيةء مثل القانون (أوامر ا لحكمة). والبحوث الأكادممية (المقالات البحثية)» والتمويل 
(تقارير فصلية). بالإضافة إلى الطب (ملخصات التفريغ) وعلم الأحياء (التفاعلات الجزئية)» 
والتقنية (ملفات براءات الاختراع)» Slad‏ عن التسويق (تعليقات العملاء). فعلى سبيل «JUL‏ 
يمكن استخدام التفاعلات النصية القائمة على النموذج الحر مع العملاء في شكل شكاوى (أو 
مدح) ومطالبات الضمان من أجل تحديد خصائص ال منتجات والخدمات التي تعتبر أقل من مثالية 
بشكل موضوعيء ويمكن اس تخدامها كمدخلات لتطوير منتجات أفضل ومخصصات الخدمة. 
وبالمثل» فإن برامج التوعية السوقية ومجموعات التركيز تولد كميات كبيرة من البيانات. ويمكن 
للعملاء تقديم أفكارهم حول منتجات وخدمات الشركة بأسلوبهم الخاصء وذلك من خلال عدم 
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تقييد التعليقات على المنتجات أو الخدمات أو جعلها مقننة. ومن المجالات الأخرى التى أثرت 

فيها المعالجة الآلية للنص غير المنظم تأثيرا كرا مجال الاتصالات الإلكترونية والبريد الإلكتروني. 

والجدير بالذكر أن التنقيب في النص لا يُستخدم فقط لتصنيف وتصفية البريد الإلكتروني غير 

الهام» Ulo‏ يمكن استخدامه LAÍ‏ لتحديد أولويات البريد الإلكتروني EAB‏ استنادًا إلى مستوى 

الأهمية بالإضافة إلى إنشاء ردود تلقائية )2004 (Weng & Liu,‏ ونذكر فيما يلي مجالات 

التطبيق الأكثر شيوعًا في التنقيب في النصوص: 

- استخراج المعلومات: تحديد العبارات والعلاقات الرئيسة داخل النص من خلال البحث عن 
الكائنات والتسلسلات المحددة مسبقًا في النص عن طريق مطابقة النمط. 

- تتبع الموضوع: استنادًا إلى ملف تعريف eue ull‏ بالإضافة إلى الوثائق التي تحتوي على 
وجهات نظر المُستخدم, فإن التنقيب في النص يمكنه التنبؤ بالوثائق الأخرى التي تهم المستخدم. 

- التلخيص: تلخيص الوثيقة توفي للوقت من جانب القارئ. 

- التصنيف: تحديد الموضوعات الرئيسة للوثيقة ثم وضعها في مجموعة كبيرة محددة مسبقًا من 
الفئات بناءٌ على تلك الموضوعات. 

- التجميع: تجميع وثائق مشابهة بدون وجود مجموعة محددة مسبقًا من الفئات. 

- ربط مفهوم: ربط الوثائق ذات الصلة من خلال تحديد ال مفاهيم S E‏ وبذلك يساعد ال مستخدمين 
في الوصول إلى المعلومات التي قد يصعب الوصول إليها باستخدام الطرق التقليدية. 

- إجابة السؤال: إيجاد أفضل إجابة لسؤال معين من خلال مطابقة النمط القائم على المعرفة. 

وللحصول على شرح لبعض المصطلحات والمفاهيم المستخدّمة في التنقيب في النص انظر رؤية 
فنية »)١-0(‏ في حين توضح الحالة العملية )1-0( استخدام التنقيب في النص في صناعة التأمين. 


رؤية فنية ١-0‏ 
مصطلحات التنقيب في النص 
توضح القائمة التالية بعض مصطلحات التنقيب في النص شائعة الاستخدام 
- بيانات غير مهيكلة (مقابل البيانات المهيكلة): للبيانات المهيكلة صيغة محددة مسبقًاء 
وعادة ما يتم تنظيمها في سجلات ذات قيم بيانات بسيطة (فئوية وترتيبية ومتغيرات 
مستمرة) ومخزنة في قواعد البيانات. وفي المقابلء فإن البيانات غير المهيكلة لا تحتوي على 
صيغة محددة مسبقاً ويتم تخزينها في شكل وثائق نصية. وتستخدم أجهزة الحاسوب 
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البيانات المهيكلة في جوهرها للقيام بالمعالجة» في حين تُستخدم البيانات غير المهيكلة 

بواسطة البشر للمعالجة والفهم. 

- مجموعة القوانين :Corpus‏ (جمع (corpora‏ وتعرف لغويًا kib‏ مجموعة كبيرة ومنسقة من 

النصوص (التي bole‏ ما يتم تخزينها ومعالجتها إلكترونيًا) تم إعدادها بغرض إجراء اكتشاف المعرفة. 

- المصطلحات: المصطلح هو عبارة عن كلمة واحدة أو عبارة متعددة الكلمات مستخرجة مباشرة 

من مجموعة قوانين خاصة بمجال معين عن طريق أساليب معالجة اللغات الطبيعية NLP‏ 

- المفاهيم: هي مواصفات يتم إنشاؤها من مجموعة من الوثائق عن طريق الوسائل 

اليدوية أو منهج تصنيف إحصائي أو قائم على القواعد أو مزيج ما بين كل ذلك. ومقارنة 

با مصطلحات» تكون المفاهيم نتيجة لفكرة تجريدية على مستوى أعلى. 

- الاشتقاق :Stemming‏ وهو عملية تقليل الكلمات المصرفة إلى أصلها (أو قاعدتها أو 
جذرها). على سبيل المثال: stemmer, stemming, stemmed‏ كلها كلمات مشتقة 
من الأصل وهو .stem‏ 

- كلمات التوقف: كلمات التوقف (أو كلمات الضجيج) وهي كلمات يتم تصفيتها قبل 
أو بعد معالجة بيانات اللغة الطبيعية (بمعنى النص). وعلى الرغم من عدم وجود 
قائمة مقبولة ble‏ لكلمات التوقف. فإن معظم أدوات معالجة اللغات الطبيعية NLP‏ 
تستخدم قانئمة تتضمن «eJ «à, am, the, of)‏ والأفعال ألمساعدة ds, are, was, were)‏ 
إلخ)» والكلمات المتعلقة بالسياق والتي تعتبر غير مميزة. 

- المرادفات والمتجانسات: المرادفات هي كلمات مختلفة نحويًا (أي مختلفة هجائيًا) لكن 
ذات معان متماثلة أو على الأقل متشابهة (مثل السينما والأفلام والصور المتحركة). وقي 
«Jail‏ فإن المتجانسات, والتي تسمى أيضًا المشتركات ABA‏ هي كلمات متطابقة نحويًا 
(أي متشابهة تمامًا من الناحية الهجائية) لكنها colo‏ معان مختلفة iad)‏ القوس هكن أن 
يعني ”الانحناء إلى الأمام“» أو ”واجهة السفينة“ أو ”السلاح الذي يطلق السهام“ أو ”نوع 
من الأشرطة المربوطة“). 

- الترميز Tokenizing‏ الرمز هو عبارة نصية يتم تصنيفها في جملة s‏ للوظيفة التي 
تؤديها. ويعرف هذا التصنيف بالترميز tokenizing‏ قد يبدو الرمز مثل أي شيء يحتاج 
أن يكون جزءًا Gal‏ من النص اممهيكل. 

- قاموس المصطلحات: وهو مجموعة من المصطلحات الخاصة بمجال محدد والتي يمكن 
استخذامها تحصر المصطلحات ال مستخرجة من داخل مجموعة القوانين (corpus)‏ 
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- تكرار الكلمات: وهو عدد مرات العثور على كلمة ما في diis‏ ما. 

- وضع علامات لجزء من الكلام :Part-of-speech tagging‏ وهو عملية وسم كلمات في 
النص كمطابقة لجزء معين من الكلام (مثل الأسماء والأفعال والصفات وظرف الحال والزمان 
والمكان» وما إلى ذلك) zo‏ على تعريف الكلمة والسياق الذي تستخدم فيه. 

- المورفولوجيا :Morphology‏ وهو فرع من علوم اللغة وجزء من معالجة اللغات الطبيعية (NLP)‏ 
والذي يدرس الهيكل الداخلي للكلمات (أنماط تنسيق الكلمة داخل لغة ما أو فيما بين عدة لغات). 

- مصفوفة Term-by-document‏ (مصفوفة الأحداث): وهي مخطط تمثيلي شائع للعلاقة 
القائمة على التكرار بين المصطلحات والوثائق في شكل جدول حيث يتم وضع ا مصطلحات في 
أعمدة. والوثائق في صفوف» ويكون التكرار بين المصطلحات والوثائق في الخلايا كقيم صحيحة. 

- فك القيمة المفرد (فهرسة دلالات الألفاظ غير المباشرة): وهي طريقة تخفيض الأبعاد وتستخدم 
لتحويل مصفوفة term-by-document‏ إلى حجم مقبول عن طريق توليد JA‏ متوسط للتكرارت 
باستخدام طريقة معالجة بارعة للمصفوفة وهي dis Jo‏ مشابهة لتحليل المكونات الأساسية. 

حالة عملية 1-0 
مجموعة التأمين تعمل على تقوية إدارة المخاطر مع حل التنقيب في النص 
عندما تم طرح سؤال عن التحدي الأكبر الذي يواجه صناعة التأمين على السيارات 
التشيكية. لم يتردد دكتور Peter Jedlic' ka‏ رئيس فريق الخدمات الاكتوارية لمكتب 
التأمينات التشيكية (CIB)‏ في التعبير عن ذلك بقوله: «تزداد مطالبات الإصابة الجسدية 
بشكل غير متناسب مقارنةٌ مطالبات تلف السيارة“. CIBs‏ هي منظمة مهنية لشركات 
التأمين في جمهورية التشيك والتي تتعامل مع المطالبات غير المؤمن عليها والدولية وغير 
المدونة لا يعرف باسم مسؤولية الطرف الثالث للسيارات. ويضيف Peter Jedlic'ka‏ 
ëg”‏ تعويضات الإصابة الجسدية الآن حوالي XEO‏ من المطالبات المقدمة ضد أعضائناء 
وستستمر هذه النسبة في التزايد بسبب التغييرات التشريعية الأخيرة“. 
وتتمثل إحدى الصعوبات التي تطرحها مطالبات الإصابة الجسدية على شركات 

التأمين في صعوبة التنبؤ بحجم الضرر المباشر من جراء حادث سيارة؛ إذ تتفاقم بعض 
الإصابات مع الوقت والتي لم تكن بتلك الحدة وقت الحادثء كما أن الإصابات التي قد 
تبدو طفيفة o‏ أن تتحول إلى حالات مزمنة. وفي السابق كانت شركات التأمين تقدّر 
بدقة مسؤوليتها عن الأضرار الطبيةء وبصورة أدق كانت تستطيع إدارة مخاطرها وتوحيد 
مواردها. ومع US‏ فإنه نظرًا لأن المعلومات المطلوبة موجودة في وثائق غير مهيكلة 
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مثل تقارير الحوادث وتصريحات الشهود. فإن الأمر يستغرق 5 طويلًا للغاية بالنسبة 
للموظفين الأفراد لإجراء التحليل اللازم. 

ولتوسيع وإجراء تحليل آلي لكل من تقارير الحوادث غير Sall‏ وعبارات الشهود 
«SUUS à uos‏ قامت CIB‏ بنشر حل تحليل البيانات استنادًا على كل من Dell‏ 
Statistica Data Miner‏ وامتذاد .Statistica Text Miner‏ حيث تقدم Statistica‏ 
Data Miner‏ مجموعة أدوات بديهية وسهلة الاستخدام. بحيث هكن الوصول إليها 
حتى من قبل غير المحللين. 

ويعمل الحل على قراءة وكتابة البيانات بشكل عملي من جميع التنسيقات المعيارية 
للملف كما يعرض أدوات تنظيف بيانات قوية ومتطورة. كما أنه يدعم حتى المستخدمين 
المبتدئين باستخدام معالجات الاستعلام والتي yaus‏ وصفات التنقيب عن البيانات» 
والتي تساعدهم في الوصول إلى الإجابات التي يحتاجونها بشكل أسرع. 

ومع امتداد Statistica Text Miner‏ يصل المستخدمون إلى أدوات الاستخراج والاختيار 
اللازمة لفهرسة وتصنيف وتجميع المعلومات من مجموعات كبيرة من البيانات النصية غير 
المهيكلةء Jio‏ صيغ مطالبات التأمين. وبالإضافة إلى استخدام حل Statistica‏ لعمل تنبؤات 
حول مطالبات الأضرار الطبية المستقبلية. فيمكن استخدام LÁ CIB‏ لإيجاد الأماط التي 
تكشف محاولات الاحتيال أو لتحديد التحسينات المطلوبة للسلامة على الطريق. 

تحسينات في دقة تقديرات المسؤولية: 

ويتوقع Jedlic"ka‏ أن يقوم حل Statistica‏ بتحسين قدرة CIB‏ بشكل كبير على 
التنبؤ بالمطالبات الطبية الكلية التي قد تنشأ عن أي حادث؛ إذ يقول: ”إن قدرات 
التنقيب في البيانات في مجال الإحصاء والتنقيب في النصوص تساعدنا بالفعل على كشف 
خصائص مخاطر إضافيةء مما يجعل من الممكن التنبؤ بالادعاءات الطبية الخطيرة في 
المراحل الأولى من التحقيق» ومع حل Statistica‏ يمكننا تقديم تقديرات أكثر دقة من 
إجمالي الأضرار والتخطيط وفقًا لذلك“. 

توسعات في عروض الخدمات للأعضاء: 

ومما زاد من سعادة Jedlic" ka‏ أيضًا من حل Statistica‏ هو أنه مكن CIB‏ من 
تقديم خدمات إضافية لأعضاء شركاتهاء حيث يقول: ”نحن في نشاط قائم على البيانات. 
ومع Sg «Statistica‏ تزويد أعضائنا بتحليلات مفصلة للمطالبات واتجاهات السوق. 
كما تساعدنا Statistica‏ في تقديم توصيات أقوى olis‏ احتياطيات المطالبات“. 
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البديهية بالنسبة لمستخدمي الأعمال: 

يمكن الوصول إلى أدوات Statistica‏ البديهية حتى من قبّل المستخدمين غير الفنيين. 
وفي هذا الصدد يقول 16011"12: ”من السهل فهم مخرجات تحليلات الإحصائيات بالنسبة 
لمستخدمي الأعمال. ويكتشف مستخدمو الشركات Uo]‏ أن نتائج التحليل تسير على نفس 
نهج تجاربهم وتوصياتهم» لذا فبإمكانهم أن يشعروا بسهولة بقيمة حل "Statistica‏ 

أسئلة للمناقشة: 

-V‏ كيف يمكن استخدام تحليلات النص والتنقيب فيه للواكبة الاحتياجات التجارية 
المتغيرة لشركات التأمين؟ 

-Y‏ ما هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 

-Y‏ هل يمكنك التفكير في استخدامات أخرى لتحليلات النصوص والتنقيب في النص 
لشركات التأمين؟ 
Sources: Dell Statistica Case Study. Insurance group strengthens risk management‏ 
with text mining solution. https://software.dell.com/casestudy/czech-insurers-‏ 


bureau-insurance-group-strengthens- risk-management-with875134/(accessed June 
2016). Used by permission from Dell. 


أسئلة مراجعة على القسم 0-: 

-١‏ ما هي تحليلات النص؟ وكيف تختلف عن التنقيب في النص؟ 

-Y‏ ما هو التنقيب في النص؟ وكيف يختلف عن التنقيب في البيانات؟ 
ISU -Y‏ يزداد انتشار التنقيب في النص كأداة تحليلية؟ 

-E‏ ما هي بعض مجالات التطبيق ASY‏ انتشارًا في التنقيب في النص؟ 


:(NLP) معالجة اللغات الطبيعية‎ Y-0 

تستخدم بعض تطبيقات التنقيب المبكر في النص تمثيلًا مبسطًا يُسمى حقيبة الكلمات وذلك 
لإضفاء الهيكلة على مجموعة من الوثائق النصية لتصنيفها إلى فئتين أو ASÍ‏ من الفئات المحددة 
مسبقًا أو تجميعها في تجمعات طبيعية. وفي نموذج حقيبة الكلمات» يتم تمثيل النص - جملة أو 
فقرة أو وثيقة كاملة - كمجموعة من الكلمات» دون تجاهل قواعد أو ترتيب ظهور الكلمات. 
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ولايزال نموذج حقيبة الكلمات يستخدم في بعض أدوات تصنيف الوثائق البسيطة. فمثلا في 
تصفية الرسائل غير cose A‏ فيهاء يمكن تصميم JU)‏ البريد الإلكتروني كمجموعة غير مرتبة من 
الكلمات (حقيبة كلمات) تتم مقارنتها بحقيبتين مختلفتين محددتين di a‏ حيث تمتلئ حقيبة 
واحدة بالكلمات الموجودة في رسائل البريد غير المرغوب فيه والأخرى مليئة بكلمات تم العثور 
عليها في رسائل البريد الإلكتروني الاعتيادية. وعلى الرغم من أنه من المتوقع وجود بعض الكلمات 
في كلا الحقيبتينء فإن حقيبة ”البريد غير المرغوب فيه“ تتكرر فيها كلمات تتعلق بالرسائل غير 
المرغوب فيها - مثل المخزونء والفياجراء والشراء - أكثر من تكرارها في الحقيبة الاعتيادية» والتي 
ستحتوي على المزيد من الكلمات المتعلقة بأصدقاء المستخدم أو مكان العمل. ويقوم مستوى 
التماثل بين حقيبة الكلمات الخاصة بالبريد الإلكتروني والحقيبتين اللتين تحتويان على التوصيفات 
بتحديد البريد الإلكتروني على أنها إما رسائل غير مرغوب فيها أو اعتيادية. 

وبطبيعة الحالء لا نستخدم نحن (البشر) كلمات غير ذات ترتيب أو هيكلء بل نستخدم 
كلمات في جمل لها بنية دلالية ونحوية. وبالتالي» فإنه يجب أن تبحث التقنيات الآلية Jio)‏ 
التنقيب في النص) عن طرق لتجاوز تفسير حقيبة الكلمات وتضمين بنية دلالية أكثر وأكثر في 
عملياتها. ويتجه التنقيب في النص Dlo‏ نحو تضمين العديد من المميزات المتقدمة التي يمكن 
الحصول عليها باستخدام معالجة اللغات الطبيعية NLP‏ 

وقد اتضح أن طريقة حقيبة الكلمات قد لا تنتج محتوى معلومات كاف بشكل جيد لمهام 
التنقيب في النص (مثل التصنيفء والتجميع؛ والاقتران). وخير مثال على dia‏ يمكننا الحصول 
عليه في الطب القائم على الأدلة. ويتمثل أحد المكونات الحساسة للطب القائم على الأدلة في 
دمج أفضل نتائج البحوث المتاحة في عملية اتخاذ القرارات الإكلينيكيةء والتي تنطوي على تقييم 
المعلومات التي تم جمعها من وسائل التواصل المطبوعة بالنسبة لصلاحيتها ومدى صلتها. وقد 
طور العديد من الباحثين من جامعة ميريلاند نماذج تقييم الأدلة باستخدام طريقة حقيبة الكلمات 
(Lin & Demner-Fushman, 2005)‏ وقد استخدموا أساليب تعلم الآلة الشائعة بالإضافة إلى 
أكثر من نصف مليون بحث تم جمعها من MEDLINE‏ (نظام تحليل وتحرير أدبيات الطب على 
الإنترنت). وقد قاموا بتمثيل كل ملخص كحقائب كلمات في النماذج التي قدموهاء حيث كان 
كل مصطلح محدد هثل ميزة. وعلى الرغم من استخدام أساليب التصنيف الشائعة مع منهجيات 
التصميم التجريبي اب مجربةء فلم تعدو نتائج التنبؤ الخاصة بهم كونها مجرد تخمين بسيطء مما 
يشير إلى أن حقيبة الكلمات لا تنتج تمثيلًا جيدًا ما فيه الكفاية للمواد البحثية في هذا ا مجال؛ 
وبالتالي فإن هناك حاجة إلى مزيد من التقنيات المتقدمة مثل معالجة اللغات الطبيعية NLP‏ 
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وتعتبر معالجة اللغات الطبيعية asd (NLP)‏ المكونات المهمة في التنقيب في النصوصء وهي 
عبارة عن مجال فرعي من الذكاء الاصطناعي وعلوم لغات الحاسوب. كما أنها تدرس مشكلة 
”فهم“ لغة الإنسان الطبيعيةء من وجهة نظر تحويل الصور البشرية (كالوثائق النصية) إلى تمثيلات 
أكثر رسمية (في شكل بيانات رقمية ورمزية) تسهل على برامج الحاسب إجراء المعالجات المطلوبة 
ببراعة. والهدف من معالجة اللغات الطبيعية هو إجراء المعالجة البارعة للنصوص اطبنية على 
بناء الجملة (والذي غالبًا ما يطلق عليه ”عد الكلمات“) بشكل يوصل إلى فهم حقيقي ومعالجة 
اللغة الطبيعية التي تدرس القيود النحوية والدلالية وكذلك السياق. 
ويعتبر تعريف ونطاق كلمة الفهم أحد موضوع ات النقاش الرئيسية في معالجة اللغات 
الطبيعية NLP‏ وبالنظر إلى أن اللغة البشرية الطبيعية مبهمة» وأن الفهم الحقيقي للمعنى 
يتطلب معرفة واسعة بموضوع ما (يتجاوز ما هو موجود في الكلمات والجمل والفقرات)» فهل 
ستتمكن أجهزة الحاسب من فهم اللغة الطبيعية بنفس الطريقة وبنفس الدقة التي يفعلها البشر؟ 
والإجابة هي لا على الأغلب! لقد قطعت معالجة اللغات الطبيعية NLP‏ شوطًا طويلًا منذ وقت 
استخدام العد البسيط للكلمات» غير أن هذه المعالجة للغات الطبيعية لديها طريقة أطول لتتمكن 
من الفهم الحقيقي للغة الإنسان الطبيعية. ونذكر فيما يلي Bae‏ قليلًا من التحديات المرتبطة 
بشكل عام بتنفيذ معالجة اللغات الطبيعية NLP‏ 
- علامات جزء من الكلام: من الصعب ترميز المصطلحات في النص على أنها تطابق جزءًا معيئًا من 
الكلام Jia)‏ الأسماء والأفعال والصفات والظروف) لأن جزء الكلام لا يعتمد فقط على تعريف 
المصطلح ولكن أيضًا على السياق الذي يتم استخدامه فيه. 
- تقسيم النص: بعض اللغات المكتوبة» مثل الصينية واليابانية والتايلاندية لا تحتوي على حدود 
مفردة للكلمات. وفي هذه الحالات GB‏ مهمة تحليل النص تتطلب تحديد حدود الكلمات» 
والتي غالبًا ما تكون مهمة صعبةء حيث تظهر تحديات مماثلة في تجزئة الكلام عند تحليل اللغة 
المحكية لأن الأصوات التي Jti‏ الحروف والكلمات المتعاقبة تمتزج مع بعضها البعض. 
- توضيح معنى كلمة: حيث توجد كلمات كثيرة لها أكثر من معنى واحد, ولا هكن أن يتحقق 
اختيار المعنى الأكثر اعتيادية إلا مراعاة السياق الذي تستخدم فيه الكلمة. 
- الغموض النحوي: حيث إن قواعد اللغة للغات الطبيعية غامضة؛ ولذلك فإن العديد من هياكل 
الجملة الممكنة في كثير من الأحيان تحتاج إلى النظر فيهاء حيث إن اختيار البنية الأكثر ملاءمة 
يتطلب bole‏ انصهار المعلومات الدلالية والسياقية. 


ev‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


- عدم الكمال أو عدم انتظام المدخلات: اللهجات الأجنبية أو الإقليمية والعوائق الصوتية في 

الكلام والأخطاء المطبعية أو النحوية في النصوص تجعل معالجة اللغة مهمة AS]‏ صعوبة. 
- أفعال لفظية: يمكن اعتبار الجملة في كثير من الأحيان إجراء من قبل المتحدث. فقد لا يحتوي 

هيكل الجملة وحده على معلومات كافية لتحديد هذا الإجراء. فعلى سبيل المثال: ”هل همكنك 

اجتياز الصف؟“ يتطلب إجابة بسيطة؛ نعم / لا في حين أن ”هل كنك تمرير اللح؟“ هو طلب 

لإجراء مادي يجب القيام به. 

لقد طال انتظار هذا الحلم من جانب مجتمع الذكاء الاصطناعي في إيجاد خوارزميات قادرة 

على القراءة والحصول على المعرفة من النص. ومن خلال تطبيق خوارزمية تعمل على نص معقد. 
قام باحثون من مختبر NLP‏ بجامعة ستانفورد بتطوير طرق يمكنها تحديد المفاهيم والعلاقات 
بين تلك المفاهيم في النص تلقائيًا. ومن خلال تطبيق إجراء فريد على كميات كبيرة من النصوص» 
فإن خوارزمياتها تحصل Glib‏ على مئات الآلاف من عناصر المعرفة العالمية وتستخدمها لإنتاج 
مستودعات معززة بشكل كبير WordNets WordNet J‏ هي قاعدة بيانات مشفرة يدويا 
من الكلمات الإنجليزيةء وتعريفاتهاء ومجموعات من المرادفات» والعلاقات الدلالية المختلفة بين 
المجموعات المترادفةء وهي مورد رئيسي لتطبيقات معالجة اللغات الطبيعيةء ولكن ثبت أن تكلفة 
بنائها وصيانتها اليدوية مرتفعة للغاية. ومن خلال إحداث المعرفة تلقائيًا في WordNet‏ فإنه 
توجد إمكانية لجعل WordNet‏ موردًا أكبر وأكثر شمولًا لمعالجة اللغات الطبيعية بجزء صغير 
من التكلفة. وتعد إدارة علاقات العملاء (CRM)‏ هي أحد المجالات البارزة التي تظهر فيها 
فوائد معالجة اللغات الطبيعية WordNets (NLP)‏ بالفعل. وبوجه عام فإن CRM‏ يسعى 
بجدية إلى تقدير العملاء من خلال فهم أفضل واس تجابة فعالة لاحتياجاتهم الفعلية واممتوقعة. 
ويُعد تحليل المشاعر أحد المجالات المهمة في إدارة علاقات العملاء (CRM)‏ حيث يكون للعالجة 
للغات الطبيعية (NLP)‏ تأثير كبير في تحليل المشاعر. وتحليل المشاعر هو تقنية تستخدم 
لكشف الآراء المؤيدة وغير المؤيدة تجاه منتجات وخدمات معينة باستخدام عدد كبير من مصادر 
البيانات النصية (ملاحظات العملاء في شكل منشورات على شبكة الإنترنت). وسوف نتناول في 
القسم 1-0 تحليل المشاعر WordNets‏ بشيء من التفصيل. 

ويمكن استخدام التحليلات بشكل عام وتحليلات النصوص والتنقيب في النص بشكل خاص في 
صناعة البث الإذاعي. وتقدم الحالة العملية Va ۲-١‏ على ذلك حيث يتم استخدام نطاق واسع من 
إمكانات التحليلات لالتقاط مشاهدين جدد وتوقع التقييمات وإضافة قيمة أعمال إلى شركات البث. 
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حالة عملية Y-0‏ 
استخدام شبكات AMC‏ التحليلات لجذب مشاهدين جدد وتقييم التوقعات وإضافة 
القيمة للمعلنين à‏ عام متعدد القنوات 

على مدى العشر سنوات الماضية كانت صناعة التلفاز المعتمد على كيبل في الولايات 
المتحدة تتمتع بفترة من النمو أتاحت إبداعًا غير مسبوق في إنشاء محتوى dle‏ الجودة. 
كانت شركة  AMC Networks‏ طليعة هذ! العصر الذهبي الجديد للتلفان مما أدى 
إلى إنتاج سلسلة من العروض المشهود لها بالنجاح بشكل حاسم مثل: Breaking Bad‏ 
.The Walking Deads Mad Mens‏ 

وتمتلك 5,5 AMC Networks à‏ المتخصصة ف إنتاج محتوى doce‏ من البرامج 
والأفلام بجودة عالية منذ أكثر من le ٠١‏ العديد من العلامات التجارية الأكثر شعبية 
والحائزة على جوائز في مجال التلفاز المعتمد على كيبل» والتي تنتج eds‏ محتوى 
مميرًا وممتعًا وثقافيًا يجذب الجماهير عبر منصات متعددة. 

تصدر اللعبة: 

وعلى الرغم من نجاح شركة AMC Networks‏ إلا أنها لا تمتلك خططًا للبقاء على 
أمجادها. وقد وضح Vitaly Tsivin‏ الباحث عن SVP Business Intelligence eU»‏ 
ذلك بقوله: ”نحن لا نقف هكذا بدون تقدم. فعلى الرغم من أن نسبة كبيرة من 
أعمالنا لا تزال lab‏ خطيًاء إلا أننا نحتاج إلى جذب جيل جديد من جيل LAYI‏ الذين 
يستهلكون المحتوى بطرق مختلفة جدًا. لقد تطور التلفاز ليصبح Mae‏ متعدد القنوات 
ومتعدد الأنظمةء ومن ثم فقد أصبحت الشبكات السلكية بحاجة إلى أن تكون أكثر 
£55 حول كيفية تسويقها والتواصل مع الجمهور عبر جميع تلك التدفقات. والجدير 
بالذكر أن الاعتماد على بيانات التقديرات التقليدية ومقدمي تحليلات الجهات الخارجية 
تعد إستراتيجية خاسرة: تحتاج إلى الحصول على ملكية بياناتك. واستخدامها للحصول 
على صورة أكثر ثراءً عن هوية المشاهدينء وماذا يريدون» وكيف كنك الحفاظ على 
انتباههم في سوق الترفيه المزدحم بشكل متزايد“. 

تقسيم المشاهدات: 

يتمثل التحدي في أن هناك الكثير من المعلومات المتاحة فقط - مثات المليارات من 
صفوف البيانات من مزودي خدمات بيانات الصناعة مثل «com-Scores Nielsen‏ 
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من قنوات AMCs TV Everywhere (s‏ التي تعيش على شبكة الإنترنت وخدمات 
الفيديو حسب الطلب» من شركاء البيع بالتجزئة Amazons iTunes Jis‏ وخدمات 
الفيديو عبر الإنترنت من جهات خارجية -Netflix and Hulu Jis‏ 

يقول :Vitaly Tsivin‏ ”لا مكننا الاعتماد على ملخصات عالية ا لمستوى؛ فنحن 
نحتاج إلى أن نكون قادرين على تحليل كل من البيانات المنظمة وغير المهيكلة» دقيقة 
بدقيقة ومشاهد مشاهد“ ويضيف 368 ”نحتاج إلى معرفة من يشاهد المحتوى dolos‏ 
ونحتاج إلى معرفة ذلك بسرعة حتى نتمكنء على سبيل المثالء من اتخاذ قرار بشأن ما là]‏ 
كان سيتم عرض إعلان أو عرض ترويجي في موضع معين خلال حلقة الرجال اممجانين“. 

وقد قررت شركة AMC‏ أنها بحاجة إلى تطوي ر القدرة التحليلية في مجال الصناعة 
داخل الشركة -وتركز على توفير هذه الإمكانية في أسرع وقت ممكن. وبدلًا من إجراء 
عملية اختيار طويلة ومكلفة للموردين واممنتجينء قررت شركة AMC‏ الاستفادة من 
علاقتها الحالية مع شركة IBM‏ كشريكها التقني الإستراتيجي الموثوق به. وبدلًا من ذلك 
فقد تم استثمار الوقت وامال الذي يتم إنفاقه تقليديًا على الشراء في تحقيق الحل -مما 
يسرع من تقدم AMC‏ على خريطة الطريق الخاصة بتحليلاتها لمدة ٦‏ أشهر على الأقل. 

تمكين قسم البحوث: 

لقد قضى فريق البحث في AMC‏ الماضي جزءً! eS‏ من الوقت في معالجة 
البيانات. واليوم تمكنت AMC‏ من تركيز معظم طاقتها على اكتساب رؤى قابلة 
للتطبيق» وذلك بفضل أدوات التحليل الجديدة. 

يقول :Vitaly Tsivin‏ ”من خلال الاستثمار في تقنية تحليلات البيانات الضخمة 
من IBM‏ تمكنا من زيادة وتيرة أبحاثنا وتفاصيلهاء فالتحليلات التي كانت تستغرق 
أيامًا وأسابيع oS‏ إنجازها الآن في »338« أو حتى ثوان. إن توفير التحليلات الداخلية 
سيوفر الكثير من التكاليف. فبدلًا من دفع مئات الآلاف من الدولارات إلى الباعة 
الخارجيين عندما نحتاج إلى بعض التحليل» فإنه يمكننا القيام بذلك بأنفسنا -بدقة «JST‏ 
وسرعة كبيرة» وتكلفة أقل بكثير. ونحن نتوقع رؤّية عائد سريع على الاستثمار. ومع 
توفر المزيد من مصادر الرؤية المحتملة والتحليلات التي أصبحت أكثر إستراتيجية لقطاع 
الأعمالء فإن النهج الداخلي هو في الواقع الطريقة الوحيدة المقبولة لأي شبكة ترغب 
É>‏ في اكتساب ميزة تنافسية من بياناتها“. 
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توجه القرارات بالبيانات: 

تُظهر العديد من النتائج التي توصل إليها هذا التحليل الجديد تحولًا حقيقيًا في 
طريقة عمل AMC‏ فعلى سبيل JÈL‏ نجد أن قسم ذكاء الأعمال في الشركة استطاع 
إنشاء نماذج إحصائية متطورة تساعد الشركة على تحسين إستراتيجياتها التسويقية 
واتخاذ قرارات أكثر ذكاءً بشأن مدى قوة الترويج لكل عرض. 





مجهزة | تقوم شركة AMC‏ بجمع بيانات 
التقييمات مع معلومات المشاهد 
من مجموعة كبيرة من القنوات 
الرقمية: خدمات الفيديو الخاصة 
بها عند الطلب وخدمات البث 
المباشر وتجار التجزئة وخدمات 
التلفاز عبر الإنترنت. 








مترابطة | يعمل محرك البيانات والتحليلات 
الضخم والشامل على تحفيز 
البيانات وجعلها متاحة لمجموعة 
من الأدوات التحليلية الوصفية 
والتنبؤية للنمذجة السريعة والإبلاغ 
والتحليل السريع. 
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ذكية | يستطيع AMC‏ التنبؤ بالبرامج 
dioe UJ‏ وكيفية ترتيبهاء والعروض 
التي يجب أن تنشئهاء ومن يجب 
عليها تسويقها- مما يساعد على 
كسب جماهير جديدة في سوق 
المنافسة المتزايدة. 





















وبنظرة أكثر عمقًا على نسبة المشاهدة. فإن حملات AMC‏ التسويقية المباشرة 
تحقق هي الأخرى نجاحًا أكبر. وفي أحد الأمثلة الحديثةء ساعدت التجزئة الذكية 
ونمذجتها الشبيهة الشركة في استهداف المشاهدين الجدد والحاليين بشكل فعال بحيث 
كانت معاملات الفيديو حسب الطلب في AMC‏ أعلى مما كان متوقعًا بخلاف ذلك. 

والجدير بالذكر أن هذه القدرة المكتشفة Éo‏ للوصول إلى مشاهدين جدد والتي 
تستند إلى احتياجاتهم وتفضيلاتهم الفردية لا تعد فقط قيمة بالنسبة إلى AMC‏ - بل 
إنها تتمتع LÉT‏ بقيمة هائلة محتملة لشركاء الإعلان في الشركة. حيث تعمل AMC‏ 
حاليًا على توفير الوصول إلى مجموعات البيانات وأدوات التحليل الغنية الخاصة بها 
كخدمة للمعلنين» مما يساعدهم على تحسين حملاتهم من أجل جذب جماهير أكبر من 
ذي قبل عبر القنوات الخطية والرقمية. 

ويخلص Vitaly Tsivin‏ إلى أنه: «هكننا الآن الاستفادة من قيمة البيانات الكبيرة. 
يمكننا بناء اقتراح أكثر جاذبية لكل من ال مستهلكين وا معلنينء وإنشاء محتوى أفضل 
وتسويقه بشكل أكثر فاعلية ومساعدته على الوصول إلى جمهور أوسع من خلال أخذ 
الاستفادة الكاملة من قدراتنا متعددة القنوات». 

أسئلة للمناقشة: 

-١‏ ما هي التحديات الشائعة التي تواجهها شركات البث في الوقت الحاضر؟ وكيف 
يمكن أن تساعد التحليلات على التخفيف من هذه التحديات؟ 

-Y‏ كيف استفادت AMC‏ من التحليلات لتعزيز slol‏ أعمالها؟ 

-Y‏ ما هي أنواع تحليلات النصوص والحلول المصغرة النصية التي طورتها شبكات 
FAMC‏ وهل كنك التفكير في استخدامات أخرى محتملة لتطبيقات استخراج النص 
في صناعة البث؟ 
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Sources: IBM Customer Case Study. Using analytics to capture new viewers, predict 
ratings and add value for advertisers in amultichannel world. http://www-03.ibm.com/ 
software/busi-nesscasestudies/us/en/corp?synkey-A023603A76220M60 (accessed 


July 2016); www.ibm.com; www.amcnetworks.com. 
بنجاح على مجموعة متنوعة من المجالات‎ NLP ويتم تطبيق معالجة اللغات الطبيعية‎ 

مجموعة واسعة من المهام عبر برامج الحاسب لمعالجة اللغة البشرية الطبيعية KAG‏ والتي كان 

يمكن القيام بها في السابق من قبل البشر فقط. وفيما يلي بع من أكثر هذه المهام شيوعًا: 

- إجابة الأسئلة: وهي مهمة الرد التلقاني على السؤال المطروح باللغة الطبيعية؛ أي إنتاج إجابة 
لغوية عند طرح سؤال لغوي بشري. وللعثور على إجابة لسؤالء فإن برنامج الحاسب قد 
يستخدم قاعدة بيانات تم تنظيمها أو مجموعة من وثائق اللغة الطبيعية (نص أساسي مثل 
(World Wide Web‏ 

- التلخيص التلقاني: وهو إنشاء نسخة من وثيقة نصية بواسطة gaby‏ حاسب يحتوي على أهم 
النقاط في الوثيقة الأصلية. 

- توليد لغة طبيعية: حيث تقوم الأنظمة بتحويل المعلومات من قواعد بيانات الحاسب إلى لغة 
بشرية يمكن قراءتها. 

- فهم اللغة الطبيعية: حيث تقوم الأنظمة بتحويل عينات من اللغة البشرية إلى تمثيلات أكثر 
رسمية يسهل على برامج الحاسب التلاعب بها. 

- الترجمة الآلية: وهي الترجمة التلقائية للغة إنسانية واحدة إلى لغة أخرى. 

- قراءة اللغة الأجنبية: برنامج حاسوبي يساعد المتحدث باللغات غير الأصلية على قراءة لغة 
أجنبية مع النطق الصحيح واللهجات على أجزاء مختلفة من الكلمات. 

- الكتابة باللغة الأجنبية: برنامج حاسب يساعد المستخدم غير الأصلي في الكتابة بلغة أجنبية. 

- التعرف على الكلام: يحول الكلمات المنطوقة إلى مدخلات قابلة للقراءة Ñ‏ وبالنظر إلى مقطع 
صوت لشخص يتحدثء ينتج النظام Éa Sa!‏ 

- النص إلى الكلام: يطلق أيضًا عليه تركيب الكلام» يقوم برنامج الحاسب GAL‏ بتحويل نص 
اللغة العادية إلى خطاب إنساني. 

- تدقيق النص: يقوم برنامج الحاسب بقراءة نسخة من النص لإثبات وتصحيح أي أخطاء. 

- التعرف الضوني على الحروف: الترجمة الآلية لصور مكتوبة بخط اليد أو مطبوعة أو مطبعية 
Šole)‏ ما يتم التقاطها بواسطة ماسح ضوثي) وتحويلها إلى وثائق نصية قابلة للتحرير i‏ 
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ويعتمد نجاح وشهرة التنقيب في النص على التقدم في معالجة اللغات الطبيعية NLP‏ في كل 
جيل كما هو الحال في فهم اللغات البشرية. وتتيح معالجة اللغات الطبيعية NLP‏ استخراج 
الخصائص من النص غير المهيكل بحيث يمكن استخدام مجموعة متنوعة من تقنيات التنقيب في 
البيانات لاستخراج المعرفة (أنماط وعلاقات جديدة ومفيدة) من ذلك النص. 


أسئلة مراجعة على القسم 3-0 

SNLP. ما هي معالجة اللغات الطبيعية‎ -١ 

-Y‏ كيف ترتبط معالجة اللغات الطبيعية بالتنقيب في النصوص؟ 

SNLP اذكر بعض الفوائد والتحديات لمعالجة اللغات الطبيعية‎ -Y 

£- ما هي المهام الأكثر انتشارًا التي تتناولها معالجة اللغات الطبيعية SNLP‏ 


٥‏ تطبيقات التنقيب في النص: 

نظرًا لزيادة كمية البيانات غير المنظمة التي يتم جمعها من قبل المؤسساتء فإن اقتراح أدوات 
للتنقيب في النص فائقة القيمة وذات انتشار واسع تزداد Lái‏ وتدرك العديد من المنظمات في 
الوقت الراهن أهمية استخراج المعرفة من مستودعات البيانات المستندة إلى الوثائق من خلال 
استخدام أدوات التنقيب في النص. وفيما يلي نذكر مجموعة فرعية صغيرة فقط من فئات 
التطبيقات المثالية للتنقيب في النص. 


تطبيقات التسويق: 
يمكن استخدام التنقيب في النص لزيادة البيع المتقاطع والبيع من خلال تحليل البيانات غير 
المهيكلة الناتجة عن مراكز الاتصال. كما يمكن تحليل النصوص التي تم إنشاؤها بواسطة ملاحظات 
مركز الاتصال» بالإضافة إلى نسخ المحادثات الصوتية مع العملاء من خلال خوارزميات التنقيب في 
النص لاستخراج معلومات جديدة وعملية حول تصورات العملاء تجاه منتجات وخدمات الشركة. 
وبالإضافة إلى eUS‏ تعد المدونات» وملاحظات المس تخدمين للمنتجات في مواقع الويب المستقلة, 
ومنشورات لوحات المناقشة TES‏ ذهبيًا هكن من خلاله التعرف على pelia‏ العملاء؛ حيث يمكن 
استخدام هذه المجموعة الغنية من ا معلومات» بمجرد تحليلها بشكل صحيح. لزيادة رضا العميل 
والقيمة الإجمالية لمدة تعامله مع الشركة. )2008 -(Coussement & Van den Poel,‏ 
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لقد أصبحت قيمة التنقيب في النص لا تُقدر بثمن لإدارة علاقات العملاء؛ حيث يمكن 
للشركات استخدام التنقيب في النص لتحليل مجموعات غنية من البيانات النصية غير الهيكلية 
مقترنة بالبيانات المنظمة ذات الصلة المستخرجة من قواعد البيانات التنظيمية: للتنبؤ بتصورات 
لعملاء وسلوك الشراء اللاحق. وقد نجح كل Van den Poelg Coussement (js‏ )2009( 
في تطبيق التنقيب في النص بنجاح من أجل تحسين قدرة نموذج ما على التنبؤ بشكل أفضل 
باضطراب العملاء (أي تناقص العملاء) بحيث يتم تحديد العملاء الأكثر عرضة alil‏ الشركة من 
أجل القيام بالتكتيكات اللازمة للحفاظ عليهم. 
وقد استخدم Ghani‏ وآخرون (Y+)‏ التنقيب في النص لتطوير نظام قادر على استنتاج 
سمات ضمنية وصريحة من المنتجات من أجل تعزيز قدرة تجار التجزئة على تحليل قواعد بيانات 
المنتجات. إن معالجة المنتجات كمجموعات من أزواج السمة والقيمة وليس ككيانات بسيطة 
يمكن أن تعزز فعالية العديد من تطبيقات الأعمالء Le‏ في ذلك التنبؤ بالطلب» وتحسين التركيب» 
بالإضافة إلى توصيات المنتجات» ومقارنة التركيب بين تجار التجزئة والمصنعين, فضلًا عن اختيار 
موردي المنتجات. ويس مح النظام المقترح للأعمال التجارية بتمثيل منتجاتها من حيث السمات 
وقيم السمات بدون جهد يدوي كبير. كما يتعلم النظام هذه السمات عن طريق تطبيق تقنيات 
التعلم تحت إشراف شبه موجه semisupervised‏ على وصف المنتجات الموجودة في مواقع 
الويب الخاصة بتجار التجزئة. 





تطبيقات الأمان: 

ربما يكون أحد أكبر وأبرز تطبيقات التنقيب في النص في مجال الأمان نظام المراقبة ECHELON‏ 
المصنف بدرجة عالية. وكما هو معروفء فإنه من المفترض أن يكون نظام ECHELON‏ قادرًا 
على تحديد محتوى المكا لات الهاتفية والفاكسات والبريد الإلكتروني وأنواع أخرى من البيانات» 
بالإضافة إلى اعتراض المعلومات المرسلة عبر الأقمار الصناعيةء وشبكات الهاتف العمومية التبديلية 
وروابط الميكروويف. 

وفي عام ۲۰۰۷م قامت EUROPOL‏ بتطوير نظام متكامل يمكنه الوصول إلى كميات هائلة من 
مصادر البيانات المهيكلة وغير المهيكلة» وتخزينها وتحليلها gan‏ الجرهة امنظمة Bless tle‏ على 
نظام التحليل الشامل لدعم أجهزة الذكاء اسم نظام (OASIS)‏ ويهدف هذا النظام إلى دمج أحدث 
تقنيات التنقيب في البيانات والنص المتوفرة في السوق في الوقت الحالي. وقد مكن نظام :781110501 
من إحراز تقدم كبير في دعم أهداف تطبيق القانون على المستوى الدولي )2007 (EUROPOL,‏ 
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CIA) ووكالة ا مخابرات المركزية‎ (EBD) كل من مكتب التحقيقات الفيدرالي الأمريكي‎ polus 
تحت إشراف وزارة الأمن الوطني» بتطوير نظام للبيانات العملاقة والنصوص. ومن المتوقع أن‎ 
النظام مستودع بيانات ضخم إلى جانب مجموعة متنوعة من وحدات البيانات والتنقيب‎ c 
في النص لتلبية احتياجات اكتشاف المعرفة لوكالات تطبيق القانون الفيدرالية والولاثية والمحلية.‎ 
وقد كان لكل من مكتب التحقيقات الفيدرالي ووكالة ا مخابرات المركزية قبل هذا المشروع قاعدة‎ 
بيانات منفصلة خاصة بهاء مع القليل من الترابط أو حتى بدونه.‎ 

duas‏ تطبيق آخر من تطبيقات التنقيب في النصوص, هذا التطبيق في مجال كشف الخداع 
وهو تطبيق التنقيب في النص على مجموعة كبيرة من التصريحات الإجرامية في العام الحقيقي 
(شخصية الفائدة)» وقد وضع كل من Deleng .Biross Fuller‏ )2008( نماذج التنبؤ لتمييز 
البيانات الكاذبة من البيانات الصادقة. وباستخدام مجموعة غنية من الإشارات المستخلصة من 
البيانات النصية» يتنبا النموذج بعينات BII‏ بنسبة AV-‏ والتي يعتقد أنها نجاح كبير مع الأخذ في 
الاعتبار أن الإشارات يتم استخلاصها فقط من البيانات النصية (لا توجد إشارات شفوية أو بصرية). 
bae‏ على ذلك» فبالمقارنة مع تقنيات كشف الخداع الأخرى» مثل جهاز كشف الكذب» OB‏ هذه 
الطريقة غير متداخلة وقابلة للتطبيق على نطاق واسع ليس فقط للبيانات النصيةء ولكن أيضًا 
(محتمل) إلى نسخ التسجيلات الصوتية. ويرد وصف أكثر تفصيلًا للكشف عن الخداع القائم على 
النص في الحالة العملية Y-0‏ 


Y-0 عملية‎ di 
التنقيب للكشف عن الأكاذيب‎ 


تواصل الاتصالات المبرمجة تقدمها مدفوعة بالتطورات في تقنيات المعلومات على شبكة 
الإنترنت وزيادة العوطةء لتتحول إلى الحياة اليومية. حاملة معها أساليب جديدة للخداع. 
فنجد أن هناك تزايدًا سريعًا في حجم الدردشة النصيةء والرسائل الفورية والرسائل النصية, 
بالإضافة إلى النص الذي تولده مجتمعات الإنترنت. بل حتى البريد الإلكتروني هو أيضًا 
مستمر في تزايد استخدامه. ومع النمو الهائل في التواصل القائم على النصوص, ازدادت 
إمكانات الناس لخداع الآخرين من خلال التواصل المحوسب. مما قد يؤدي إلى نتائج كارثية. 

ولسوء الحظء فإن البشر بشكل ele‏ يميلون إلى التكاسل وعدم بذل الجهد في مهام 
كشف الخداع» وتتفاقم هذه الظاهرة في الاتصالات القائمة على النص. وقد شمل جزء 
كبير من البحث عن كشف الخداع (المعروف أيضًا بتقييم المصداقية) في الاجتماعات 
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والمقابلات الشخصية المباشرة. ومع ذلكء ومع نمو الاتصالات القائمة على النصوصء فإن 
تقنيات الكشف عن الخداع المستندة إلى النصوص تعد ضرورية. 

وهناك تقنيات للكشف عن الخداع بنجاح» وقد حظيت هذه التقنيات بقابلية 
تطبيقها على نطاق واسع؛ حيث هكن لتطبيق القانون استخدام أدوات وتقنيات دعم 
القرار للتحقيق في الجرائم» وإجراء الفحص الأمني في المطارات, ومراقبة اتصالات 
الإرهابيين المشتبه بهم. وقد يستخدم المتخصصون ف الموارد البشرية أدوات كشف 
الخداع لفحص المتقدمين. فهذه الأدوات والتقنيات لديها أيضًا القدرة على فحص رسائل 
البريد الإلكتروني للكشف عن الاحتيال أو غيرها من الأفعال الخاطئة التي ارتكبها ضباط 
الشركات. وعلى الرغم من أن بعض الناس يعتقدون أنهم يستطيعون التعرف بسهولة 
على أولئك الذين ليسوا صادقينء إلا أن ملخضًا لأبحاث الخداع أظهر أن متوسط نسبة 
الأشخاص الذين يدققون في اتخاذ قرارات صائبة هي 0£ )2006 «(Bond & DePaulo,‏ 
وقد يكون هذا الرقم في الواقع أسوأ عندما يحاول البشر اكتشاف الخداع في النص. 

وباستخدام مجموعة من تقنيات التنقيب في النص والتنقيب في البيانات» قام كل من 
Fuller‏ وآخرون (8١٠٠م)‏ بتحليل البيانات الشخصية التي استغلها أشخاص متورطون 
في جرائم في قواعد عسكرية؛ حيث يطلب من المشتبه بهم والشهود في هذه البيانات 
كتابة ما يتذكرونه من الحدث بكلماتهم الخاصة. وقد قام الموظفون المكلفون بتنفيذ 
القانون العسكري بتفتيش البيانات الأرشيفية للإدلاء بتصريحات هكن أن يحددوها 
بشكل قاطع بأنها صادقة أو خادعة. وقد اتُخذت هذه القرارات على أساس الأدلة 
الموثقة وحالة القضية. وبعد أن يتم تصنيفهم كصادقين أو مخادعينء يقوم الموظفون 
المكلفون بتنفيذ القانون بإزالة معلومات تحديد الهوية ويقدمون البيانات إلى فريق 
البحث. وفي المجموع. تم تلقي lo YVY‏ قابا للاستخدام للتحليل. وقد اعتمدت 
طريقة الكشف عن الخداع المبنية على النص التي استخدمها Fuller‏ وآخرون «(eV tA)‏ 
على عملية تُعرف باسم التنقيب في خاصية الرسائل والتي تعتمد على polis‏ البيانات 
وتقنيات التنقيب في النص. ويعرض الشكل (Y-0)‏ وصفًا مبسطًا للعملية. 

sl‏ أعد الباحثون البيانات للمراجعة» حيث يجب أن يتم نسخ البيانات الأصلية 
المكتوبة بخط اليد في ملف معالجة النصوص. SB‏ تم تحديد السمات (مثل: 
الإشارات)» حيث قام الباحثون بتحديد VY‏ سمة تمثل فئات أو أنواعًا من اللغة مستقلة 
نسبيًا عن محتوى النص ويمكن تحليلها بسهولة عن طريق وسائل آلية. فعلى سبيل 
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EEY 


«JUL‏ يمكن تعريف ضمير الشخص الأولء مثل: أنا أو لي دون تحليل للنص المحيط. 
ويسرد الجدول (Y-0)‏ الفئات وقائمة أمثلة بالخصائص المستخدمة في هذه الدراسة. 


في ملف ثابت لزيد من 


وقد تم استخراج الميزات من البيانات النصية وإدخالها 


المعالجة. وياستخدام العديد من طرق اختيار الخصائص بالإضافة إلى التحقق المتقاطع 
من ٠١‏ أضعافء قارن الباحثون دقة التنبؤ بثلاث طرق شائعة للتنقيب في البيانات. وقد 
أشارت النتائج إلى أن نماذج الشبكات العصبية كانت صاحبة الأداء الأفضل بنسبة دقة 
تنبؤية بلغت ۷۳,١١‏ على عينات بيانات الاختبار. وجاءت أشجار القرار في المركز الثاني 


بنسبة 10,۲۸ ⁄. 





بنسبة AVNI‏ في حين حل في المركز الأخير الانحدار اللوجستي 


وتشير النتائج إلى أن الكشف التلقائي عن الخداع المبني على النص لديه القدرة على 


بنجاح على بيانات العام 
كشف الخداع الأخرى» 


مساعدة المكلفين بهذه المهمةء ويمكن تطبيق هذه الطريقة 
الحقيقي. وقد تجاوزت دقة هذه التقنيات دقة معظم تقنيات 
وذلك على الرغم من أنها كانت تقتصر على الإشارات النصية. 














دلالات مستخرجة 




















النص 


شكل 0-¥: عملية كشف الخداع القائمة على 
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جدول :Y-0‏ فئات وأمثلة من الميزات اللغوية المستخدمة في كشف الخداع 









































e‏ الفئة إشارات المثال 
۱ الكمية عدد الأفعال» عدد عبارات الأسماء إلخ 
۲ التعقيد متوسط عدد الجمل ومتوسط طول الجملة وما إلى ذلك 
eas | Y‏ اليقين (الشك) امعدلات» الأفعال الشرطيةء إلخ 
ع | عدم الفورية الصوت المنفعلء والتصنيفء وما إلى ذلك 
|o‏ التعبيرية Emotiveness‏ 
1 التنوع التنوع المعقول. التكرار إلخ 
۷ الغير رسمية نسبة الأخطاء المطبعية 
|A‏ الخصوصية |المعلومات الزمانية ASKU‏ وا معلومات الإدراكيةء وما إلى ذلك 
٩‏ التأثير تأثير gl]‏ وتأثير سلبيء إلخ 
أسئلة للمناقشة: 


-١‏ اذا يصعب كشف الخداع؟ 

-Y‏ كيف يمكن استخدام التنقيب à‏ النص / البيانات للكشف عن الخداع à‏ النص؟ 

-Y‏ ماهي التحديات الرئيسة في رأيك لمثل هذا النظام الآلي؟ 
Sources: Fuller, C. M., Biros, D., & Delen, D. (2008). Exploration of feature‏ 
selection and advanced classification models for high-stakes deception detection.‏ 
Proceedings of the 41st Annual Hawaii International Conference on System‏ 
Sciences (HICSS), Big Island, HI: IEEE Press, 8099-; Bond C. E, & DePaulo, B.‏ 


M. (2006). Accuracy of deception judgments. Personality and Social Psychology 
Reports, 10(3), 214234-. 


التطبيقات الطبية الحيوية: 
يحمل التنقيب في النص إمكانات كبيرة للمجال الطبي بشكل عام والطب الحيوي على وجه 


الخصوصء وذلك لعدة أسباب. أولاه التوسع ف الأدبيات (المواد المطبوعة) والمنشورات المنشورة 
(خاصة مع ظهور المجلات المفتوحة المصدر) في الميدان معدل أسي. Alo LG‏ مع معظم 
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المجالات الأخرىء فإن الأدبيات (المواد المطبوعة) الطبية هي AS]‏ توحيدًا وتنظيمًاء مما يجعلها 
مصدر معلومات ”أكتر ملاءمة“. وأخيراء تكون ا مصطلحات المستخدمة في هذا الكتاب ثابتة نسبيًاء 
مع وجود ele)‏ الوجود) ontology‏ الموحد إلى حد lo‏ وفيما يلي بعض الدراسات النموذجية حيث 
تم استخدام تقنيات التنقيب في النص بنجاح في استخراج أنماط جديدة من الأدب الطبي الحيوي. 

إن التقنيات التجريبية مثل تحليل الحمض النووي المجهري (DNA)‏ والتحليل امتسلسل 
للانطباع الجيني (SAGE)‏ ومجموعة «spectrometry proteomics‏ وغيرهاء تولد كميات كبيرة 
من البيانات المتعلقة بالجينات والبروتينات. وكما هو الحال في أي نهج تجريبي آخرء فمن 
الضروري تحليل هذا الكم الهائل من البيانات في سياق المعلومات المعروفة سابقًا حول الكيانات 
البيولوجية قيد الدراسة. وتعتبر الأدبيات مصدرًا قيمًا للغاية للمعلومات للتحقق من صحة 
التجارب وتفسيرها. ولذلك؟ فإن تطوير أدوات التنقيب الآلي عن النصوص للمساعدة في مثل هذا 
التفسير هو أحد التحديات الرئيسية في أبحاث المعلوماتية الحيوية الحالية. 

إن معرفة موقع البروتين داخل الخلية يمكنه أن يساعد على توضيح دور تلك الخلية في 
العمليات الحيوية وتحديد إمكاناتها كهدف دوائي. وقد تم وصف العديد من أنظمة تحديد 
الموقع في الأدبيات؛ حيث يركز البعض على كائنات معينةء في حين يحاول البعض الآخر تحليل 
مجموعة واسعة من الكائنات الحية. وقد اقترح Shatkay‏ وآخرون (eY + V)‏ نظامًا شاملا يستخدم 
عدة أنواع من السمات المتسلسلة والنصية للتنبؤ موقع البروتينات. ويكمن التجديد الرئيس 
لنظامهم في الطريقة التي يتم بها اختيار مصادر النص وميزاته ودمجها مع ميزات متسلسلة. وقد 
قاموا باختبار النظام على مجموعات البيانات المستخدمة سابقًا وعلى مجموعات بيانات جديدة 
وضعت خصيصًا لاختبار قوتها dal‏ حيث أظهرت النتائج أن نظامهم يتغلب باستمرار على 
النتائج التي تم الإبلاغ عنها مسبقًا. 

أما Chun‏ وآخرون (5١٠٠٠م)‏ فقد قاموا بوصف نظام يستخرج علاقات الجين المرضي من 
لأدبيات التي يتم الوصول إليها عبر MEDLINE‏ حيث قاموا ببناء قاموس لأسماء الأمراض 
والجينات من ست قواعد بيانات عامة واستخرجوا العلاقة بين المرشحين عن طريق مطابقة 
القاموس. ونظرًا GY‏ مطابقة القاموس تنتج عددًا uS‏ من النتائج الإيجابية لكنها غير صحيحة 
فقد طوّروا طريقة للتعرّف على الكيان القائم على تعلم الآلة المسمى بكيان التعرف (NER)‏ 
لتصفية التقديرات الخاطئة لأسماء الأمراض / الجينات. ووجد الباحثون أن نجاح استخلاص 
العلاقة يعتمد بشكل كبير على elof‏ تصفية NER‏ وأن التصفية حسّنت دقة اس تخلاص العلاقة 
بنسبة ۲,۷ على تكلفة انخفاض صغير في إعادة الاتصال. 
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ويبين الشكل )0-£( صورة مبسطة لعملية تحليل نص متعدد المستويات لاكتشاف العلاقات 
بين الجينات والبروتينات (أو تفاعلات البروتينات والبروتينات) في الأدبيات الطبية الحيوية 
Nakov)‏ وآخرون» .)7٠١0‏ وكما يتبين في هذا JUL‏ المبسط الذي يس تخدم جملة بسيطة من 
النص الطبي الحيويء حيث يتم أولا ف che‏ الثلاثة السفلية) ترميز النص باستخدام جزء 
من الكلام مع قليل من التعديلء ثم تتم مطابقة المصطلحات (الكلمات) الرمزية (وتفسيرها) 
مقابل التمثيل الهرمي لنطاق un ele‏ لاشتقاق العلاقة بين الجين والبروتين. إن تطبيق هذه 
الطريقة (و / أو بعض اختلافاتها) على الأدبيات الطبية الحيوية يوفر إمكانات كبيرة لفك شفرة 
التعقيدات في مشروع „Human Genome‏ 
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شكل 0-£: تحليل متعدد المستويات للنص لتحديد تفاعل الجين/ البروتين 

التطبيقات الأكاديمية: 

تحظى مسألة التنقيب في النص بأهمية كبيرة بين الناشرين الذين لديهم قواعد بيانات كبيرة 
من المعلومات التي تتطلب فهرسة لاسترجاعها بشكل أفضل. وهذا صحيح بشكل خاص في 
التخصصات العلمية, والتي غالبًا ما تكون معلومات محددة للغاية يتضمنها النص المكتوب. وقد 
تم إطلاق مبادرات» مثل: اقتراح الطبيعة لواجهة التنقيب في النص TAI‏ والتعريف الشائع 
لنوع وثيقة نشر المعاهد الوطنية للصحة. والتي من شأنها أن توفر مؤشرات دلالية آلية للإجابة 
عن استفسارات محددة موجودة في النص دون إزالة حواجز الناشر للوصول إلى الجمهور. 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


كما أطلقت المؤسسات الأكادهية مبادرات التنقيب في النص. فنجد على سبيل المثال أن المركز 
الوطني للتنقيب في النص - وهو جهد تعاوني بين جامعتي مانشستر وليفرب ول - يوفر أدوات 
مخصصة» ومرافق بحثء ومشورة حول التنقيب في النص للمجتمع الأكادهي» مع التركيز das!‏ على 
التنقيب على النص في العلوم البيولوجية والطبية الحيويةء وقد توسعت الأبحاث منذ ذلك الحين في 
العلوم الاجتماعية. وفي الولايات المتحدةء تقوم كلية الإعلام في جامعة كاليفورنياء بيركليء بتطوير 
goly‏ يدعى bioText‏ لمساعدة الباحثين في العلوم البيولوجية في التنقيب في النصوص وتحليلها. 

وكما هو موضح في هذا القسم. GB‏ التنقيب في النص يحتوي على مجموعة متنوعة من التطبيقات 
في عدد من التخصصات المختلفة. انظر الحالة العملية )6-0( للاطلاع على مثال لكيفية استخدام الشركة 
الرائدة في تصنيع منتجات الحوسبة في معالجة النصوص؛ من أجل فهم احتياجات ورغبات العملاء 
الحاليين وا محتملين المتعلقة بجودة المنتج وتصميم المنتج بشكل أفضل. 


حالة عملية €-O‏ 
إدراج العميل ضمن معادلة الجودة: تستخدم لينوفو Lenovo‏ التحليلات من أجل 
إعادة التفكير في إعادة تصميمها 

كانت لينوفو Lenovo‏ تقترب من التصميم lal‏ لتحديث تخطيط لوحة المفاتيح 
لأحد أشهر أجهزة الحاسب الخاصة بها عندما رصدت مجتمعًا صغيرًا من اللاعبين على 
الإنترنت. غير أنه يعتبر مجتمعًا مهمًا وكبيرء يدعم تصميم لوحة المفاتيح الحالي. وقد 
gol‏ هذا التغيير في التصميم إلى تمرد جماعي لقطاع كبير من قاعدة عملاء لينوفو - 
المطورين المستقلين واللاعبين. 

وقد كانت وحدة تحليلات الشركات تستخدم 545 كجزء من مشروع الجودة 
الجوهرية. وبتتبع الويب» وغربلة البيانات النصية التي تشير إلى لينوفو. كشف التحليل 
عن منتدى لم يكن معروقًا من قبل, أن أحد العملاء الحاليين كتب مراجعة متألقة من 
ست صفحات للتصميم dol «lodi‏ لوحة المفاتيح. وقد جذب هذا الاستعراض ٠٠٠٠١‏ 
تعليق! يقول Mohammed Chaara‏ مدير تحليل العملاء :VOC Analytics‏ ”¢ 
يكن الأمر شيئًا وقد وجدناه في المراجعات التقليدية لتصميم ما قبل الإنتاج“. 

وقد كان هذا النوع من الاكتشافات الذي عزز التزامات الشركة لنظام لينوفو 
للكشف المبكر (LED)‏ وعمل Chaara‏ وفريق تحليلات الشركات الخاص به. 
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الفصل الخامس 


مم تنطلق شركة لينوفوء أكبر شركة لأجهزة الحاسب الشخصية والأجهزة اللوحية على 
مستوى العام» لقياس مشاعر المدونين الغامضين أو اكتشاف المنتديات الجديدة. أرادت 
الشركة إحراز الجودة وتطوير وابتكار المنتجات من خلال دراسة البيانات -الخاصة بها 
ومن خارج الجدران الأربعة. يقول :Chaara‏ ”نحن نركز بشكل رئيسي على تحسين 
سلسلة التوريدء وفرص البيع / بيع منتج عن طريق إقناع الزبون» والتسعير والتعبئة 
للخدمات. وأي تحسينات نجريها في هذه المجالات تستند إلى الاستماع إلى العميل“. 
وتوفر SAS‏ الإطار ”لإدارة كمية البيانات المجنونة“ التي يتم إنشاؤها. 

وقد انتشر نجاح المشروع كالنار في الهشيم Jalo‏ منظمة. حيث خططت لينوفو 
في البداية لنحو YO‏ مستخدمًاء ولكن شغهيًا وصلت إلى ٠٠٠١‏ مستخدم قاموا بتسجيل 
الدخول إلى لوحة المعلومات LED‏ لعرض مرق حول معنويات العملاء. والضمانء 
وتحليل مركز الاتصال. 

وكانت النتائج مذهلة: 
- تخفيض أكثر من X0*‏ من وقت اكتشاف المشكلة. 
- تخفيض بنسبة من <٠١‏ إلى 10* في تكاليف الضمان من العيوب الخارجة عن الطبيعي. 
- تخفيض بنسبة من 2٠١‏ إلى “0٠‏ في مكالمات مركز الاتصال للمعلومات العامة. 
النظر إلى الصورة الكبيرة: 
تتميز الطرق التقليدية لقياس المشاعر وجودة الفهم بنقاط الضعف والتأخر الزمني: 
- تعرض استطلاعات العملاء معلومات فقط من العملاء الراغبين في ذلك. 
Glè -‏ ما db‏ معلومات الضمان بعد أشهر من تسليم المنتج الجديد. 
- قد يكون من الصعب فك شفرة الكثير من الأسباب لسخط العملاء ومشكلات المنتج. 

وبالإضافة إلى ذلك تتبع لينوفو منتجها وتعبئته ببرامج لا تنتجهاء ويستخدم العملاء 
مجموعة متنوعة من ا ملحقات (محطات الإرساء وأجهزة الماوس) التي قد تكون أولا 
تكون منتجات لينوفو. ولزيادة المشكلةء تعمل الشركة في Vio‏ دولة وتدعم JS]‏ من 
di sd ٠‏ لذلك كانت الطرق اليدوية لتقييم التعليق متعارضةء واستغرقت الكثير من 
الوقتء bs‏ يكن بمقدورها التوسع في حجم التعليقات التي كانت تراها في وسائل 
التواصل الاجتماعي. ويجب أن يكون تحليل المشاعر قادرًا على إدراك الفروق الدقيقة 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


في اللغات المحلية. de)‏ سبيل «JULI‏ طريقة وصف الأستراليين للأشياء تختلف عن 
طريقة وصف الأمريكان). 

وقد وفر الاكتشاف القائم على التحليل لمشكلة في محطات قاعدة الشحن ثاني فوز 
كبير LED sl‏ الخاصة Lenovo‏ حيث كان العملاء يتصلون بالدعم الفني ليقولوا 
إنهم يواجهون مشاكل في ASLI‏ أو أن الجهاز مغلق بشكل مفاجئ أو أن البطارية لا 
تشحن. وقد ظهرت حسابات مماثلة على مواقع وسائل التواصل الاجتماعي. في بعض 
الآحيان» ولكن ليس lo‏ ذكر العميل لإرساء السفن docking‏ لم يكن الأمر كذلك قبل 
أن تستخدم لينوفو SAS‏ لتحليل مجموعة مكؤنات مراكز الاتصال ومشاركات وسائل 
التواصل الاجتماعي التي ربطت كلمة إرساء docking‏ بالمشكلة. مما ساعد مهندسي 
الجودة على معرفة السبب الجذري وإصدار تحديث للبرنامج. 

يقول :Chaara‏ ”لقد تمكنا من gar‏ هذه التعليقات في غضون ga Lad‏ وكانت 
تستغرق من ٠١‏ إلى Go ٠١‏ لأننا اضطررنا إلى انتظار عودة التقارير من الميدان”. والآن 
يستغرق الأمر من YO‏ إلى so ٠٠١‏ فقط. وقد أدى هذا الانخفاض في وقت الاكتشاف 
إلى انخفاض بنسبة ٠١‏ إلى 10* في تكاليف الضمان لهذه المشكلات. والتي تبلغ حوالي 
۲۱ مليار دولار gua‏ وهذه توفيرات كبيرة. 

وعلى الرغم من أن معلومات مركز الاتصال كانت حاسمة» إلا أن مكون وسائل 
التواصل الاجتماعي هو ما أغلق الصفقة. يقول :Chaara‏ ”مع تويتر وفيسبوك. وصف 
الناس ما كانوا يفعلونه في تلك اللحظة قائلين: لقد استقرت الآلة وحدث XX‏ إنها 
خامدة وغير متحيزة وقوية للغاية“. 

وقد تم العثور على فكرة غير متوقعة عند تحليل ما يقوله العملاء أثناء تشغيل 
أجهزة الحاسب الشخصية الخاصة بهم. كما أدركت لينوفو أن وثائقها لشرح منتجاتهاء 
والضمانات» وما شابه م يكن واضحًا. قال Chaara‏ ”هناك تكلفة لكل ALS‏ مركز 
الاتصال. وبفضل الوثائق المحسنة. شهدنا انخفاضًا بنسبة من **٠‏ إلى *0٠‏ في المكامات 
الواردة للحصول على معلومات عامة“. 

الإشادة بالفوز وراء الخطوط الأمامية: 


كان المشروع ناجحًا lie‏ لدرجة أن Chaara‏ عرضه على CEO‏ والهدف هو تكوين عرض 
لوحة معلومات ل .C-suite‏ يقول :Chaara‏ ”هذا هو مستوى التفكير من كبار التنفيذيين 
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الفصل الخامس 


لديناء فهم يؤمنون lig‏ وبالإضافة إلى ذلكء ستقوم مجموعة Chaara‏ بقياس نجاح هذا 
الجهد بشكل رسمي وتوسيعه لقياس قضايا مثل تجربة العملاء عند شراء منتج "Lenovo‏ 

وقد أدى تطبيق التحليلات في نهاية المطاف إلى فهم أكثر شمولية لمفهوم الجودة. 
فالجودة ليست مجرد جهاز حاسب يعمل بشكل صحيح. ولكنها تعني معرفة الناس 
كيفية استخدامه» والحصول على مساعدة سريعة ودقيقة من الشركة. والحصول على 
مكونات غير تابعة لشركة لينوفو للعمل بشكل جيد مع الأجهزة. وفهم ما يعجب العملاء 
بشأن المنتج Fiu- Jodl‏ من إعادة تصميمه فقط لآن مصممي المنتجات يعتقدون أنها 
الثيء الصحيح الذي ينبغي القيام به. يقول 088218: ”لقد سمحت لنا SAS‏ بالحصول 
على تعريف للجودة من وجهة نظر العميل“. 

أسئلة للمناقشة: 

-١‏ كيف استخدمت لينوفو تحليلات النصوص والتنقيب في النص لتحسين جودة 
وتصميم منتجاتها وفي النهاية تحسين رضا العملاء؟ 

-Y‏ ما هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 
المصادر: ”إحضار العميل إلى معادلة الجودة (SAS* Visual Analytics, SAS* Contextual‏ 
Analysis, SAS Sentiment Analysis, SAS* Text Miner)‏ - تحليل المشاعر والتحليلات المتقدمة 
تساعد لينوفو على تحديد مشكلات الجودة ورغبات العملاء بشكل أفضل“. 2016 © Copyright‏ 
Institute Inc., Cary, NC, USA‏ 545. أعيد طبعها بإذن. كل الحقوق محفوظة. 


أستلة مراجعة على القسم 6-0: 

-١‏ اذكر وناقش باختصار léw‏ من تطبيقات التنقيب في النص في مجال التسويق. 
-Y‏ كيف يكن استخدام التنقيب في النص في الأمن ومكافحة الإرهاب؟ 

*- ما هي بعض تطبيقات التنقيب الواعدة في النص في مجال الطب الحيوي؟ 


0-0 عملية التنقيب في النص: 


لكي تنجح دراسات تحليل النصء فلابد أن تتبع منهجية سليمة تستند إلى أفضل الممارسات. 
حيث يلزم وجود نموذج عملية موحدة مماثل للعملية القياسية للتنقيب في البيانات الصناعية 
(CRISP-DM)‏ والذي يُعد معيار الصناعة لمشاريع التنقيب في البيانات (انظر الفصل 6). deg‏ 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


الرغم من أن معظم أجزاء CRISP-DM‏ قابلة للتطبيق Lol‏ مشروعات التنقيب في النص» فإن 
النموذج المحدد لعملية التنقيب في النص سيشمل أنشطة أكثر تفصيلًا لعالجة البيانات. ويصور 
الشكل )0-0( مخططًا سياقيًا Jle‏ المستوى لعملية التنقيب في النص النموذجية )& Delen‏ 
(Crossland, 8‏ حيث يعرض الرسم التخطيطي لهذا السياق نطاق العمليةء مع التأكيد على 
واجهاتها مع البيئة الأكبر. وأما في جوهره فإنه يرسم حدودًا حول العملية المحددة لتحديد ما 
يتم إدراجه في (وما يتم استبعاده من) عملية استخراج النص بشكل واضح. 
حدرد البرمجيات كالاجهزة 
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s‏ المعرفة المتعلقة بالسياق 











شكل 0-0: مخطط السياق لعملية التنقيب في النص 

وكما يشير الرسم البياني للسياقء فإن المدخلات (الاتصال الداخلي إلى الحافة اليسرى من ا مربع) 

في عملية اكتشاف المعرفة المستندة إلى النص هي البيانات غير المهيكلة وكذلك المهيكلة التي تجمع 
وتخزن للعملية. والناتج (الامتداد الخارجي من الحافة اليمنى للمربع) من العملية هو المعرفة 
المحددة للسياق والتي يمكن استخدامها لصنع القرار. وتتضمن polis‏ التحكم» التي تسمى أيضًا 
القيود (الاتصال الداخلي إلى الحافة العلوية للمربع)» العملية الخاصة بالحدود من البرامج والأجهزة, 
ومشكلات الخصوصية: والصعوبات المتعلقة بمعالجة النص المقدم بلغة طبيعية. LÍ‏ الآليات فتشمل 
(الاتصال الداخلي على الحافة السفلية للمربع) الخاصة بالعملية على التقنيات المناسبة وأدوات 
البرامج وخبرات المجال. والغرض الأساسي من التنقيب في النص (ضمن سياق اكتشاف المعرفة) هو 
معالجة البيانات غير النصية (مع البيانات aliit‏ إذا كانت ذات صلة با مش كلة التي يتم تناولها 
والمتاحة) لاستخراج نماذج ذات معنى وقابلة للتطبيق من أجل اتخاذ قرارات أفضل. 
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الفصل الخامس 


ويمكن تقسيم عملية التنقيب في النص ذات المستوى العالي جدًا إلى ثلاث مهام متتاليةء لكل 
منها مدخلات محددة لإنتاج نواتج معينة (انظر الشكل 1-0( B‏ لم يوافق ناتج المهمة ما هو 
متوقع, لأي سببء فلا بد من الرجوع لتنفيذ المهمة السابقة. 
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شكل 0- عملية التنقيب في النص ثلاثية الخطوات والمهام 


المهمة :١‏ تأسيس الجزء الأساسي: 

ويتمثل الغرض الرئيس من نشاط المهمة الأول في جمع كل الوثائق المتعلقة بالسياق (مجال 
الاهتمام) الذي تتم دراسته. وقد تتضمن هذه المجموعة الوثائق النصية وملفات XML‏ ورسائل 
البريد الإلكتروني وصفحات الويب والملاحظات القصيرة. بالإضافة إلى البيانات النصية المتوفرة 
بسهولةء ويمكن أيضًا تسجيل التسجيلات الصوتية باستخدام خوارزميات التعرف على الكلام 
وجعلها جزءًا من مجموعة النصوص. 

وبمجرد تجميعهاء يتم تحويل الوثائق النصية وتنظيمها بطريقة تجعلها كلها في نفس الشكل 
التمثيلي (مثل الملفات النصية 45011) dedil‏ الحاسب. ويمكن أن تكون عملية تنظيم الوثائق 
بسيطة Jia‏ مجموعة من مقتطفات النصوص الرقمية المخزنة في مجلد ملفء أو يمكن أن تكون 
مجموعة من الروابط لمجموعة من صفحات الويب في مجال معين. كما يمكن أن تقبل العديد من 
أدوات برامج التنقيب في النص المتاحة É ylos‏ كمدخلات وتحويلها إلى ملف مسطح للمعالجة. 
وبدلًا من ذلك فإنه من الممكن إعداد الملف المسطح خارج goby‏ استخراج النص ثم تقديمه 
كمدخل إلى تطبيق استخراج النص. 


المهمة !: تأسيس مصفوفة :Term-Document‏ 


وفي هذه المهمة»ء يتم استخدام الوثائق الرقمية والمنظمة (المجموعة) لإنشاء مصفوفة Term-)‏ 
.Document (TDM‏ حيث تمثل الصفوف في الوثائق. أما الأعمدة فتمثل المصطلحات. 
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وتتميز العلاقات بين الشروط والوثائق بمؤشرات (أي: مقياس علائقي هكن أن يكون بسيطًا مثل 
عدد مرات حدوث المصطلح في الوثائق ذات الصلة). ax‏ الشكل (V-0)‏ مثالا نموذجيًا على TDM‏ 
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شكل :V-0‏ المصفوفة البسيطة Term-Document‏ 
ويتمشل الهدف lazo‏ في تحويل LEB‏ الوثائق المهيكلة (المجموعة) إلى TDM‏ حيث يتم تعبئة 
الخلايا بالمؤشرات الأكثر ملاءمة. أما الافتراض فهو أنه يمكن تمثيل جوهر الوثيقة بقائمة وتكرار 
المصطلحات المستخدمة في تلك الوثيقة. ومع ذلك فهل جميع ال مصطلحات مهمة عند توصيف 
الوثائق؟ والواضح أن الإجابة هي «لا». فبعض المصطلحات. مثل: المقالات والأفعال المساعدة 
والمصطلحات المستخدمة في جميع الوثائق في ا مجموعةء ليس لها أي اختلاف في القوةء وبالتالي يجب 
استبعادها من عملية الفهرسة. aig‏ هذه القائمة من المصطلحات. والتي يُطلق عليها bole‏ مصطلح 
”شروط التوقف“ أو ”كلمات التوقف“ خاصة بمجال الدراسة ويجب تحديدها بواسطة خبراء ا مجال. 
ومن ناحية أخرىء فإن المرء قد يختار مجموعة من المصطلحات المحددة Ls‏ والتي بموجبها يتم 
فهرسة الوثائق (وتسمى هذه القائمة من المصطلحات بشكل ملائم مصطلحات أو قاموس). بالإضافة 
إلى ذلك فإنه من الممكن Lol‏ توفير المرادفات (أزواج المصطلحات التي سيتم التعامل معها بنفس 
الطريقة) والعبارات المحددة (مثل ”برج إيفل“) بحيث تكون مدخلات الفهرس أكثر دقة. 
ومن عمليات الترشيح الأخرى التي ينبغي إجراؤها لإنشاء هذه المؤشرات بدقة ما يشير 
إلى إرجاع الكلمات إلى جذوره ا بحيث ez‏ على سبيل المثال تحديد أشكال نحوية مختلفة 
أو انحرافات للفعل وفهرستها على أنها الكلمة نفسها. فعلى سبيل JÈL‏ سوف يضمن النهج 
التشغيلي أن يكون التشكيل والتصميم s pss‏ على غرار نموذج الكلمة. 
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ويتضمن الجيل الأول من TDM‏ جميع ا لمصطلحات الفريدة التي تم تحديدها في المجموعة 
(كأعمدة (lu‏ باستثناء تلك الموج ودة في قائمة التوقف؛ بالإضافة إلى جميع الوثائق (كصفوفها» 
وعدد التكرارات لكل مصطلح لكل وثيقة (كقيم الخلية الخاصة بها). وكما هو شائع» فإن المجموعة 
إذا تضمنت uS Bue‏ من الوثائق» فهناك فرصة جيدة جدًا ON‏ يتضمن نموذج TDM‏ عددًا f.‏ 
جدًا من المصطلحات. وقد تستغرق معالجة مثل هذه المصفوفة الكبيرة L gb Ég‏ والأهم من 
ذلكء أنها قد تؤدي إلى استخراج أنماط غير دقيقة. وعند هذه النقطة يتعين على المرء أن يقرر ما يلي: 
)١(‏ ما هو أفضل تمثيل للمؤشرات؟ (V)‏ كيف هكننا تقليل أبعاد هذه المصفوفة إلى حجم معقول؟ 

تمثيل المؤشرات: مجرد أن تتم فهرسة وثائق الإدخال وتحويل ترددات الكلمة AUSSI‏ (حسب 
الوثيقة)ء فإنه هكن إجراء عدد من التحويلات الإضافية لتلخيص وتجميع ال معلومات المستخرجة. 
وتعكس ترددات المصادر الخام عمومًا مدى بروز أو أهمية الكلمة في كل وثيقة. وبوجه «ol‏ 
فإن الكلمات ذات التكرار الأكبر في الوثيقة هي واصفات أفضل لمحتويات تلك الوثيقة. ومع 
ذلك» فمن غير المعقول أن نفترض أن الكلمة تعد نفسها مناسبة مع أهميتها كواصفات للوثائق. 
فمثلاء إذا حدثت كلمة مرة واحدة في الوثيقة A‏ في حين أنها في الوثيقة B‏ حدثت ثلاث مرات» 
فليس من المعقول بالضرورة أن نستنتج أن هذه الكلمة هي ثلاثة أضعاف أهمية واصف الوثيقة 
B‏ مقارنة بالوثيقة A‏ وللحصول على نظام TDM‏ أكثر اتساقًا لإجراء مزيد من التحليلء فيجب 
Sof‏ تطبيع هذه المؤشرات الأؤّلية. وعلى عكس إظهار التعداد الفعلي للتردد» فإنه يمكن تطبيع 
التمثيل العددي بين المصطلحات والوثائق باستخدام عدد من الطرق البديلة» مثل ترددات السجل 
والترددات الثنائية وترددات الوثائق العكسية» وغيرها. 

تقليل أبعاد المصفوفة: نظرًا لأن نظام TDM‏ غالبًا ما يكون hie S‏ ومتناثرًا إلى حد ما (معظم 
الخلايا مملوءة بالأصفار)» فإن السؤال الآخر المهم هو sce AS»‏ تقليل أبعاد هذه المصفوفة إلى 
حجم معقول؟» حيث تتوفر العديد من الخيارات المتاحة لإدارة حجم المصفوفة. 
- يمر خبير Jill‏ بقائمة المصطلحات ويزيل تلك التي لا معنى لها لسياق الدراسة (عملية يدوية 

تتطلب عمالة كثيرة). 

- إلغاء الشروط مع عدد قليل le‏ من الظروف في عدد قليل lo‏ من الوثائق. 
- تحويل المصفوفة باستخدام انحلال القيمة المفردة SVD‏ 








ويؤدي انحلال القيمة المفردة (SVD)‏ والذي يرتبط ارتباطًا وثيقًا بتحليل المكونات الأساسية, 
إلى تقليل الأبعاد الإجمالية لمصفوفة الإدخال (عدد وثائق الإدخال حسب عدد المصطلحات 
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المستخرجة) إلى مساحة أصغرء حيث هثل كل بُعد تالي أكبر درجة ممكنة من التقلبية (بين 
الدرجات والوثائق) )1999 (Manning & Schutze,‏ ومن الناحية المثالية:ء فإن المحلل قد 
يحدد البعدين أو الثلاثة أبعاد الأبرز التي تمثل معظم التباين (الاختلافات) بين الكلمات والوثائق» 
وبالتالي تحديد المساحة الدلالية الكامنة التي تنظم الكلمات والوثائق في التحليل. وجرد تحديد 
هذه الأبعادء يتم استخراج ”المعنى“ الأساسي يلا هو موجود (تمت مناقشته أو وصفه) في الوثائق. 


المهمة ؟: استخراج المعرفة: 

حيث يتم استخراج أنماط جديدة في سياق المشكلة المحددة التي يتم تناولهاء باستخدام 
نموذج TDM‏ المنظم dao‏ والذي يمكن زيادته مع عناصر بيانات منظمة أخرى. أما الفئات 
الرئيسة لطرق استخلاص المعرفة فهي التصنيفء والتجميع» والاقتران» وتحليل الاتجاهات. وفيما 
يلي وصف موجز لهذه الطرق. 

التصنيف: وهكن القول أن أكثر موضوعات اكتشاف المعرفة شيوعًا في تحليل jolas‏ البيانات 
Asl)‏ 63 هو تصنيف أشياء معينة. وتتمثل المهمة في تصنيف البيانات المعطاه إلى مجموعة من 
الفئات المحددة مسبقًا. كما أنه ينطبق على مجال التنقيب في النص» حيث تُعرف اممهمة باسم 
تصنيف النص. فبالنسبة e garb‏ معينة من الفئات (الموضوعات أو النقاط أو المفاهيم) ومجموعة 
من الوثائق النصيةء OB‏ الهدف هو العثور على الموضوع الصحيح (الموضوع أو المفهوم subject‏ 
(or concept‏ لكل وثيقة باستخدام النماذج التي تم تطويرها مع مجموعة بيانات التدريب التي 
تنضمن كلاً من الوثائق وفئات الوثائق الفعلية. واليوم يتم تطبيق تصنيف النص التلقائي في 
مجموعة متنوعة من السياقات» ا في ذلك فهرسة النص التلقاني أو شبه التلقاي (التفاعلي)» وتصفية 
الرسائل غير ا مرغوب فيهاء بالإضافة إلى تصنيف صفح ات الويب ضمن كتالوجات «darn y‏ وتوليد 
(lab‏ للبيانات الوصفية؛ واكتشاف النوع» فضلًا عن العديد من الأنواع الأخرى. 

وأما النهجان الرئيسان لتصنيف النصء فهما هندسة المعرفة وتعلم الآلة 
(Feldman & Sanger, 2007)‏ وباستخدام منهج هندسة المعرفة يتم ترميز معرفة الخبير حول 
الفثات في النظام lal‏ بصورة عرضية أو في شكل قواعد تصنيف إجرائية. أما مع منهج تعلم AYI‏ 
فإن العملية الاستقرائية العامة تبني luae‏ من خلال التعلم من مجموعة من الامثلة المعاد 
تصنيفها. ومع زيادة عدد الوثائق معدل أسيء ومع ازدياد صعوبة معرفة خبراء المعرفة, فإن 
الاتجاه الأكثر انتشارًا بين الاثنين هو الاتجاه نحو نهج تعلم الآلة. 
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التجميع: وه و عملية غير خاضعة للإشراف؛ حيث يتم تصنيف الكائنات إلى مجموعات 
«طبيعية» تسمى المجموعات. بالمقارنة مع التصنيف الذي يتم فيه استخدام مجموعة من الأمثلة 
التدريبية المصنفة مسبقًا لتطوير نموذج يعتمد على السمات الوصفية للفئات لتصنيف مثال 
جديد غير مذكور. أما في التجميع» فإن المشكلة تتمثل في تجميع مجموعة غير معلمة من الأشياء 
(مثل: الوثائق» والزبون» والتعليقات» وصفحات الويب) في مجموعات ذات مغزى دون أي معرفة 


مسبقة. 


X sio‏ التجميع مفيدًا في نطاق واسع من التطبيقات, بدءًا من استرجاع الوثائق إلى تمكين 
عمليات بحث أفضل في محتوى الويب. وفي الواقع» فإن أحد التطبيقات البارزة للتجميع هو 
التحليل والإبحار في مجموعات نصية كبيرة die‏ مثل صفحات الويب. والافتراض الأساسي هو أن 
الوثائق ذات الصلة تميل إلى أن تكون أكثر تشابهًا مع بعضها البعض من غير التي ليس لها صلة 
با لموضوع. BE‏ كان هذا الافتراض GB‏ فإن تجميع الوثائق اعتمادًا على تشابه محتواها يُحسّن 
فعالية البحث )2007 :(Feldman & Sanger,‏ 
- استرجاع بحث تم تحسينه: ولأن التجميع يستند إلى تشابه عام بدلا من وجود مصطلح واحده 
فإنه من الممكن أن يؤدي إلى تحسين استرجاع بحث معتمد على الاستعلام بطريقة تطابق 
استعلام وثيقة Sce‏ استرجاع المجموعة الكاملة منها. 
- تحسين دقة البحث: حيث هكن للتجميع Lái‏ أن يحسن دقة البحث. فمع نمو عدد الوثائق في 
degana‏ يصبح من الصعب استعراض قائمة الوثائق المطابقة. ويمكن أن يساعد التجميع على 
تجميع الوثائق في عدد من ا مجموعات الأصغر حجمًا من الوثائق ذات الصلةء وطلبها حسب 
الصلة وعرض الوثائق من المجموعة (أو المجموعات) الأكثر صلة. 
وأما الطريقتان الأكثر شيوعًا للتجميع فهما التجميع المبعثر / المجمع والتجميع الخاص 
بالاستعلام: 
- التجميع المبعثر: حيث يُستخدم التجميع كطريقة لتصفح الوثائق وذلك لتحسين كفاءة التصفح 
البشري للوثائق عندما لا هكن صياغة استعلام بحث معين, معنى أن هذه الطريقة تقوم 
بشكل ديناميي بإنشاء جدول محتويات لمجموعة وتقوم بتكيفها وتعديلها استجابة لاختيار 
المستخدم. 
- التجميع الخاص بالاستعلام :Query-specific clustering‏ وتستخدم هذه الطريقة نهجًا 
تجميعي ا للتسلسل الهرمي حيث تظهر أكثر الوسائل ذات الصلة بالاستعلام المطروح في 
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مجموعات ضيقة صغيرة متداخلة في مجموعات أكبر تحتوي على وثائق أقل تشابهاء مما 
يؤدي إلى وجود مجموعة من مستويات الملاءمة بين الوثائق. وتؤدي هذه الطريقة أداءً جيدًا 
لمجموعات الوثائق ذات الأحجام الكبيرة واقعيًا. 
الاقتران: وقد تم تقديم تعريف رسمي ووصف مفصل للاقتران في الفصل الخاص بالتنقيب 
في البيانات (الفصل الرابع). يُعد تعليم الارتباط أو قواعد الارتباط في مجال التنقيب في البيانات 
أسلوبًا شائعًا وبحنًا جيدًا لاكتشاف علاقات مثيرة للاهتمام بين المتغيرات ف قواعد البيانات 
الكبيرة. وتتمثل الفكرة الرئيسة في إنشاء قواعد الارتباط (أو حل مشكلات سلة السوق) في تحديد 
المجموعات المتكررة التي تتماثى Aia‏ 
ds‏ التنقيب في النصء يشير الارتباط تحديدًا إلى العلاقات اممباشرة بين المفاهيم (المصطلحات) 
أو مجموعات المفاهيم. ويمكن تحديد مفهوم مجموعة قواعد القاعدة 4+0 المتعلقة بمجموعتي 
المفهوم المتكررتين Cs A‏ بواسطة المقياسين الأساسيين للدعم والثقة. وفي هذه الحالةء فإن الثقة 
هي النسبة المئوية للوثائق التي تتضمن جميع المفاهيم في C‏ داخل نفس المجموعة الفرعية من 
تلك الوثائق التي تتضمن جميع المفاهيم في LA‏ أما الدعم فهو النسبة (أو العدد) من الوثائق 
التي تتضمن جميع المفاهيم في A‏ وعلى سبيل JGB‏ فقد يظهر في مجموعة الوثائق مفهوم 
”فشل تنفيذ البرامج“ W‏ مقترنًا مع ”تخطيط موارد اممؤسسة“ و”إدارة علاقات العملاء“ بدرجة 
دعم معنوي (XE)‏ ومستوى ثقة )00( وهذا يعني أن XE‏ من الوثائق كانت تشتمل على جميع 
المفاهيم الثلاثة ممثلة في نفس الوثيقةء والوثائق التي شملت ”فشل في تنفيذ البرامج“» X00‏ منها 
شملت LÍ‏ ”تخطيط موارد المؤسسات» و”إدارة علاقات العملاء“. 
وقد تم استخدام التنقيب في النص مع قواعد الاقتران لتحليل الأدبيات المنشورة (الأخبار 
والمقالات الأكادهية المنشورة على الويب) لرسم ii‏ مرض أنفلونزا الطيور وتطوره Mahgoub)‏ 
وآخرون» .)7٠١8‏ كانت الفكرة هي تحديد الارتباط التلقائي بين المناطق الجغرافية» والانتشار عبر 
الأنواع» والتدابير المضادة (العلاجات). 
تحليلات الاتجاه: تستند الأساليب الحديثة لتحليلات الاتجاه في مجال التنقيب في النص على 
فكرة أن أنواع مختلفة من توزيعات المفهوم هي وظائف مجموعات الوثائقء وهذا يعني أن 
مجموعات مختلفة تؤدي إلى توزيعات مختلفة للمفهوم لنفس مجموعة المفاهيم. ولذلك؛ فإنه من 
الممكن مقارنة التوزيعين اللذين يتطابقان بشكل ما إلا أنهما من توزيعات فرعية مختلفة. ويتمثل 
أحد الاتجاهات الملحوظة لهذا النوع من التحليل في وجود مجموعتين من نفس المصدر (على سبيل 
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المثال من نفس مجموعة الدوريات الأكاديمية) ولكن من نقاط زمنية مختلفة. وقد طبق كل من 
(Y+ +A) Crosslands Delen‏ تحليل الاتجاه على عدد كبير من المقالات الأكادهية (المنشورة في 
المجلات الأكادهية الثلاث الأعلى تصنيقًا) لتحديد تطور المفاهيم الأساسية في مجال نظم المعلومات. 
وكما هو موضح في هذا القسم» فإن هناك العديد من الطرق المتاحة للتنقيب في النص. وتصف 
الحالة العملية )0-0( استخدام عدد من التقنيات المختلفة في تحليل مجموعة كبيرة من الأدبيات. 
حالة عملية 0-0 
مسح بحوث الأدبيات بالتنقيب في النص 
يواجه الباحثون الذين يجرون عمليات بحث واستعراض للأدبيات ذات الصلة مهمة 
معقدة وضخمة على نحو متزايد. وقد كان من امهم Glo‏ العمل بجد gazd‏ المعلومات 
الحالية من الأدبيات وتنظيمها وتحليلها واستيعابهاء من أجل توسيع نطاق المعرفة OR‏ 
الصلةء لا سيما من خلال الانضباط المنزلي. ومع تزايد وفرة الأبحاث الهامة المحتملة 
التي يتم الإبلاغ عنها في المجالات ذات الصلةء وحتى في المجالات التي تعتبر تقليديًا 
Jo i>‏ غير مرتبطة بالدراسة» OB‏ مهمة الباحث تصبح أكثر صعوبةء إذا كانت هناك 
حاجة إلى عمل شامل. 
ds‏ تيارات البحث الجديدة. قد تكون مهمة الباحث أكثر مللا وتعقيدًا. ففي 
أحسن الأحوالء قد يكون من الصعب محاولة العثور على الأعمال ذات الصلة التي 
ذكرها الآخرون» بل Us‏ يكون شبه مستحيل إلى حد كبير إذا كانت هناك حاجة إلى 
مراجعات تقليديةء للأبحاث المنشورة. فحتى مع وجود مجموعة من طلاب الدراسات 
العليا المتفانين أو الزملاء المساعدينء فإن محاولة تغطية جميع الأعمال المنشورة ذات 
الصلة المحتملة هي إشكالية. 
وهناك العديد من المؤتمرات العلمية التي تُعقد كل eple‏ بالإضافة إلى توسيع نطاق 
المعرفة بالتركيز الحالي على المؤتمرء حيث يرغب المنظمون في كثير من الأحيان في تقديم 
minitracks‏ وورش عمل إضافية. وفي العديد من الحالات. تهدف هذه الأحداث 
الإضافية إلى تعريف الحضور على تيارات بحث مهمة في مجالات الدراسة ذات الصلة 
ومحاولة تحديد ”الشيء الكبير التالي“ من حيث الاهتمامات البحثية والتركيز. Gis‏ ما 
يكون تحديد مواضيع المرشح ال معقول ممثل هذه الثورات وورش العمل SIS‏ بدلا من 
اشتقاق موضوعي من الأبحاث الحالية والناشئة. 
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às‏ دراسة dhao‏ اقترح كل من Crosslans Delen‏ (۲۰۰۸) طريقة تساعد جهود 
الباحثين بشكل كبير وتعززها من خلال تمكين التحليل شبه الآلي للكميات الكبيرة من 
الأبحاث المنشورة من خلال تطبيق التنقيب في النص. وباس تخدام المكتبات الرقمية 
القياسية ومحركات بحث النشر على الإنترنت» قام المؤلفون بتنزيل garg‏ جميع 
المقالات المتاحة للمجلات الثلاث الرئيسة في مجال نظم المعلومات الإدارية: MISQ‏ 
ربع السنوي 4MISQ)‏ وبحوث نظم المعلومات (ISR)‏ ومجلة نظم معلومات الإدارة 
.(JMIS)‏ وللحفاظ على الفترة الزمنية نفسها لجميع المجلات الثلاث (للدراسات الطولية 
المقارنة المحتملة). تم استخدام المجلة مع تاريخ البدء الأخير لتوفر النشر الرقمي كوقت 
بدء هذه الدراسة (أي أن مقالات JMIS‏ متوفرة رقميًا منذ 4€ (Y‏ بالنسبة لكل مقالة, 
حيث قاموا باستخلاص العنوان» والملخصء وقائمة ا مؤلفين» والكلمات المفتاحية المنشورة 
والحجم» ورقم الإصدارء وسنة النشرء ثم قاموا بتنزيل كل بيانات IAL‏ في ملف قاعدة 
بيانات بسيط. كما تم تضمينه في مجموعة البيانات المدمجة التي لها مجال مشترك, 
والذي يحدد نوع المجلة لكل مادة من أجل تحليل تمييزي محتمل. كماتم حذف 
الملاحظات التحريرية والملاحظات البحثية والنظرات العامة التنفيذية من ا مجموعة. 
يوضح الجدول التالي كيفية عرض البيانات بتنسيق جدولي. 

وقد اختاروا في مرحلة التحليل استخدام ملخص للمقالة فقط كمصدر لاستخراج 
المعلومات. كما اختاروا عدم تضمين الكلمات ا مفتاحية dej‏ في المنشورات لسببين 
رئيسين: )١(‏ في ظل الظروف العاديةء فإن الملخص سيش مل بالفعل الكلمات اللفتاحية 
deja‏ وبالتالي فإن إدراج الكلمات المفتاحية المدرجة للتحليل سيعني تكرار نفس 
المعلومات ويحتمل أن يمنحهم وزنًا غير مستحق, (Y)‏ قد تكون الكلمات المفتاحية المدرجة 
عبارة عن كلمات يرغب المؤلفون في أن ترتبط مقالتهم بها e)‏ عكس ما هو موجود فعلًا 
في (IAN‏ وبالتالي قد يكون من المحتمل تقديم تحيز غير قابل للتحليل لتحليل المحتوى. 





ID‏ |العام | مجلة نبذة مختصرة 





الحاجة إلى ابتكار قيم مستمرة هي دفع سلاسل 
التوريد للتطور من 
على الرغم من أن الكثير من الأفكار المعاصرة تعتبر 
تقنية المعلومات اللتقدمة. 


MISQ| 2005 | |) 1 








ISR |1999 | 2 

















JMIS | 2001 | 3‏ | عندما يواجه منتجو البضائع sl)‏ الخدمات) وضعًا والذي ... 
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ID‏ العام مجلة نبذة مختصرة 





ISR | 1995 | 4‏ | أصبحت أهمية الحفاظ على الذاكرة التنظيمية مهمة ل ... 


البحث الوارد هنا هو تكيف لنموذج تم تطويره 
soldi‏ 








ISR | 1994 | PID005 





MISQ| 1995 | 6‏ | تقيم هذه الدراسة مدى القيمة المضافة للعملاء من ... 





هذه الورقة هي تقارير لنتائج (-) من دراسة ميدانية 
لستة فرّق للمشروع الطبي ... 
JMIS | 1999 | 98‏ | بدأ الباحثون والمديرون يدركون أن المزايا الكاملة .... 


MISQ | 2003 | PID007 








تقنيات التجارة عبر الإنترنت قد خَفُضت إلى حد كبير 


JMIS | 2000 | 9‏ 
تكاليف البائعين. 





نظرية التركيب التكيفية (AST)‏ أصبحت بسرعة 
نظرية مؤثرة. 

يظهر البحث أن نظم دعم المجموعة (GSS)‏ قد زادت 
بشكل كبير. 

يطالب سير الأعمال بشكل متزايد بأن تلعب تقنية 
المعلومات دور الأعمال التجارية. 


ISR |1997 | PID0010 





JMIS | 1995 PID0011 


MISQ | 2000 PID0012 





من المعتقد على نطاق galg‏ أن التوافق بين إستراتيجية 
العمل وإستراتيجية TS‏ 


ISR | 2001 | PID0013 





تم توضيح إطار يتضمن تخطيط أهداف تقنية 


JMIS | 1999 | PIDO014 
ا معلومات وتحديدها.‎ 





... تتطلب‎ (IT) الأهمية المتزايدة باستمرار لتقنية المعلومات‎ | JMIS | 1999 | PID0015 





MISQ| 1994 | PID0016‏ | تحديد أفضل طريقة لتنظيم وظائف IS‏ داخل اممؤسسة. 





ISR | 1996 | PID0017‏ | أسباب ردود الفعل المختلطة لتداول اليوم الإلكتروني غير التبادلي. 

















JMIS | 1996 | PID0018‏ | آثار الأداء لاستثمارات تقنية المعلومات في المنظمة. 
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EU 





ID‏ | العام | مجلة نبذة مختصرة 





الكشف عن الهوية فهوم أساسى 4 È‏ 
A JMIS | 1997 | PID0019‏ عن الهوية هو مفهوم أسامي في بحوث 
نظم دعم المجموعة GSS)‏ 
على الرغم من أن التجارة الإلكترونية (EC)‏ قد خلقت 
فرضًا جديدة للعمل. 

JMIS | 2005 | 1‏ | فهم الاعتماد الناجح لتقنية المعلومات إلى حد كبير. 





ISR | 2002 | 0 








نظم تخطيط موارد المؤسسة (ERP)‏ وغيرها من 
المعلومات المعقدة. 


11150 2005 | PIDO022 





JMIS | 1994 | 3‏ | نظم إدارة نموذج دعم نماذج في مختلف مراحل النموذج. 
بينما يتم التعرف على تدريب الحاسب على نطاق 
guls‏ باعتباره الحاسب الأسامي. 





ISR | 1995 PID0024 














وقد كانت الدراسة الاستكشافية الأولى هي النظر في المنظور الطولي للمجلات الثلاث 
(أي تطوير موضوعات البحث بمرور الوقت). ومن أجل إجراء دراسة glo‏ قسموا فترة 
ال ١1‏ سنة (من 1994 إلى 27٠٠0‏ إلى أربع فترات بحيث تكون كل فترة عبارة عن ثلاث 
سنوات لكل من المجلات الثلاث. وقد أدى هذا الإطار إلى VY‏ تجربة للتنقيب في النص 
مع ١١‏ مجموعة من البيانات الحصرية المتبادلة. عند هذه النقطةء وقد استخدمت 
كل مجموعة من مجموعات البيانات الاثنتي عشرة التنقيب في النص لاستخراج أكثر 
العبارات وصفية من هذه المجموعات من المقالات التي تمثلها ملخصاتهاء وتم جدولة 
النتائج وفحصها للتغييرات الزمنية المتغيرة في الشروط المنشورة في هذه المجلات الثلاث. 

وكاستكشاف HË‏ باستخدام مجموعة البيانات الكاملة Ue)‏ في ذلك اممجلات الثلاث 
وجميع الفترات الأربع)» قاموا بإجراء تحليل للتجميع. وهكن القول أن التجميع هو 
jS‏ تقنيات معالجة النصوص استخدامًا. وقد تم استخدام التجميع في هذه الدراسة 
لتحديد المجموعات الطبيعية للمقالات (عن طريق وضعها في مجموعات منفصلة) ثم 
سرد أكثر العبارات وصفية التي ميزت تلك المجموعات. كما استخدموا SVD‏ لتقليل 
الأبعاد من مصفوفة الوثائق من 13« ومن ثم خوارزمية تعظيم التوقعات لإنشاء 
التجمعات. وقد أجريت العديد من التجارب لتحديد العدد الأمثل للمجموعات» والتي 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الخامس 


تبين أنها تسعة. وبعد cly‏ التجمعات التسعة. قاموا بتحليل محتوى تلك ا مجموعات 
من منظورين: )١(‏ تمثيل نوع المجلة (انظر الشكل 8-0أ). (Y)‏ تمثيل الوقت (الشكل 
-8ب). وكانت الفكرة هي استكشاف الاختلافات المحتملة والقواسم المشتركة بين 
المجلات الثلاث والتغييرات امحتملة في التركيز على هذه المجموعات؛ أي للإجابة على 
أسئلة مثل: ”هل هناك مجموعات تمثل مواضيع بحث مختلفة خاصة ilaç‏ واحدة؟“ 
و”هل هناك توصيف زمني متفاوت لهذه المجموعات؟“ اكتشفوا وناقشوا bli Bas‏ 
مثيرة للاهتمام باستخدام تمثيل جدولي ورسوم بيانية من النتائج التي توصلوا إليها 
(وطزيد من المعلومات. انظر: 2008 „(Delen & Crossland,‏ 


-١‏ كيف يمكن استخدام التنقيب في النص لتسهيل المهمة التي لا هكن التخلب عليها 
مراجعة الأبحاث المنشورة؟ 

-Y‏ ماهي النتائج الشائعة لمشروع التنقيب في النص لمجموعة محددة من مقالات 
الدوريات؟ وهل يمكنك التفكير في النتائج المحتملة الأخرى التي لم يتم ذكرها في هذه الحالة؟ 
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Histogram of JOURNAL; categorized by CLUSTER 
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Source: Delen, D., & Crossland, M. (2008). Seeding the survey and analysis of research literature 
with text mining. Expert Systems with Applications, 34(3), 1707- 1720. 
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الشكل 6-5: أ- توزيع عدد المقالات للمجلات الثلاث على ا مجموعات التسع 
ب- تطوير المجموعات التسع على مر السنين 
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أسئلة مراجعة على القسم 0-0: 
-١‏ ما هي الخطوات الرئيسة في عملية التنقيب في النص؟ 
-Y‏ ما هو سبب اعتدال ترددات الكلمات؟ وما هي الطرق الشائعة لاعتدال ترددات الكلمات؟ 
la -*‏ هو SSVD‏ وكيف يتم استخدامه في التنقيب في النص؟ 
-E‏ ما هي طرق استخراج المعرفة الأساسية من مجسم القوانين؟ 
1-0 تحليل المشاعر: 

نعتبر نحن البشر كائنات اجتماعية بارعة في الاستفادة من مجموعة متنوعة من وسائل 
التواصل» وكثيرًا ما نتشاور مع منتديات المناقشة المالية قبل اتخاذ قرار الاستثمار؛ فنسأل أصدقاءنا 
عن آرائهم حول مطعم تم افتتاحه bas‏ أو فيلم تم إنتاجه dodo‏ كما نقوم بإجراء عمليات 
بحث على الإنترنت وقراءة تعليقات المستهلكين وتقارير الخبراء قبل إجراء عملية شراء كبيرة مثل 
منزل أو سيارة أو جهاز. ونحن نعتمد على آراء الآخرين لاتخاذ قرارات أفضل» خاصة في منطقة 
لا نملك فيها الكثير من المعرفة أو الخبرة. وبفضل تزايد توافر موارد الإنترنت الغنية بالرأي مثل 
وسائل التواصل الاجتماعي (مثل (Facebooks Twitter‏ ومواقع المراجعة على الإنترنت والمدونات 
الشخصية؛ أصبح الآن من السهل أكثر من أي وقت مضى العثور على آراء الآخرين (الآلاف منهم, 
كما هو واقع الأمر) على كل شيء من أحدث الأدوات إلى الشخصيات السياسية والعامة. وعلى 
الرغم من عدم التعبير عن آراء عبر الإنترنت - بسبب الغالبية المتزايدة لعدد قنوات التواصل 
الاجتماعي وقدراتها - إلا أن الأرقام تتزايد بشكل كبير. ومن الصعب وضع تعريف محدد لكلمة 
المشاعرء حيث إنها has la Ul‏ بمصطلح ات أخرى أو تختلط معها مشل الاعتقاد. والرؤية, 
«sl Jls‏ بالإضافة إلى القناعة. وتشير المشاعر إلى وجود رأي ثابت يعكس مشاعر المرء Mejova,)‏ 
2009(. وللمشاعر بعض الخصائص الفريدة التي تميزها عن المفاهيم الأخرى التي قد نرغب في 
تحديدها في النص. وغالبًا ما نرغب بتصنيف النص حسب الموضوع. والذي قد يتضمن التعامل 
مع تصنيفات كاملة للموضوعات. ومن ناحية أخرىء boled‏ ما يقوم تصنيف المشاعر بالتعامل 
مع فئتين (إيجابي مقابل سلبي)» أو نطاق من التناقض (على سبيل JEL‏ تصنيف النجوم للأفلام)» 
أو حتى نطاق قوة (Pang & Lee, 2008) (sl Ji‏ وتمتد هذه الفئات لتشمل العديد من المواضيع 
وا لمستخدمين والوثائق. وعلى الرغم من أن التعامل مع DLS‏ قليلة فقط قد يبدو مهمة أسهل 
من تحليل النص القياسيء إلا أن هذا أبعد ما يكون عن الحقيقة. 

وكمجال للبحثء فإن تحليل المشاعر يرتبط ارتباطًا os‏ باللسانيات الحاسوبية. معالجة اللغات 
الطبيعية NLP‏ والتنقيب à‏ النصوص. ولتحليل المشاعر العديد من الأسماء Gleg‏ ما يشار 
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إليه على أنه استخراج «sl JE‏ وتحليل الذاتيةء واستخراج التقييم» مع بعض الاتصالات بالحوسبة 
العاطفية (التعرف على الحاسب والتعبير عن الانفعال). إن الاندفاع المفاجئ في الاهتمام والنشاط 
في مجال تحليل المشاعر (أي استخراج الرأي)» الذي يتناول الاستخراج التلقائي للآراء وا لمشاعر 
والدهوقراطية في النص» ينتج فرضًا وتهديدات للشركات والأفراد على حد سواء» ولن يستفيد منها 
سوى الأشخاص الذين يتقبلونها وينتفعون منها ... وسوف يتم اعتماد كل رأي يتم طرحه على 
الإنترنت من قبل فرد أو شركة إلى المنشئ (جيد أو سيئ) كما سيتم استرداده واستخراجه بواسطة 
الآخرين WE)‏ ما يتم ÉSA‏ بواسطة برامج الحاسب). 

ويحاول تحليل المشاعر الإجابة عن السؤال التالي «ما الذي يشعر به الناس تجاه موضوع معين؟» 
عن طريق البحث في آراء الكثيرين باستخدام مجموعة متنوعة من الأدوات الآليةء وذلك من خلال 
الجمع بين الباحثين وا ممارسين في مجالات الأعمال وعلوم الحاسب واللغويات الحاسوبية والتنقيب في 
البيانات والتنقيب في النصوص بالإضافة إلى علم النفس وحتى علم الاجتماع. ويهدف تحليل المشاعر إلى 
توسيع نطاق تحليل النصوص القائم على الحقائق التقليدية إلى حدود جديدة لتحقيق نظم المعلومات 
الموجهة نحو الرأي العام. وفي إطار الأعمال التجاريةء خاصة في التسويق وإدارة علاقات العملاء يسعى 
تحليل المشاعر إلى الكشف عن الآراء الإيجابية وغيرها تجاه منتجات أو خدمات معينة باستخدام أعداد 
كبيرة من مصادر البيانات النصية (ملاحظات العملاء في شكل نشرات الويب» وتويتر. والمدونات» إلخ). 

dos‏ الشعور الذي يظهر في النص بصفتين مميزتين: كونه صريحًا؛ حيث تعبر الجملة الشخصية 
مباشرة عن رأي G)‏ يوم رائع“)» كما أنه ta‏ حيث يشير النص إلى رأي (”ينفصل المقبض بسهولة 
كبيرة“). وقد ركز معظم العمل السابق في تحليل المشاعر على النوع الأول من المشاعر لأنه أسهل في 
التحليل. أما الاتجاهات الحالية» فهي تنفيذ طرق تحليلية للنظر في المشاعر الضمنية والصريحة. إن 
تناقض المشاعر هي سمة خاصة للنص الذي يركز تحليل المشاعر في المقام الأول caule‏ وعادةٌ ما يتم 
تقسيمها إلى قسمين: موجبة وسالبة» ولكن يمكن اعتبار الأقطاب أيضًا كنطاق. وسوف يعتري الوثيقة 
التي بها العديد من البيانات المرتقبة خلط في التناقض الكاملء وهو يختلف عن عدم وجود تناقض 
مطلقًا (كونها موضوعية؛ 2009 (Mejova,‏ إن جمع وتحليل البيانات النصية ف الوقت المناسب» 
والتي قد QU‏ من مجموعة متنوعة من المصادر - بدءًا من نسخ مراكز اتصال العملاء إلى منشورات 
وسائل التواصل الاجتماعي - تعد جزءًا Gla‏ من قدرات الشركات الاستباقية والتركيز على العملاء في 
الوقت الحاضرء وفي كثير من الأحيان يتم تصوير هذه التحليلات بشكل فوري للبيانات النصية في 
لوحات المعلومات سهلة الفهم. وتقدم الحالة العملية )1-0( قصة نجاح العميل» حيث يتم استخدام 
مجموعة من حلول التحليلات جماعيًا لتعزيز تجربة المشاهدين في بطولة ويمبلدون للتنس. 
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حالة عملية 5-4 


إنشاء تجربة رقمية فريدة لرصد اللحظات المهمة في وهبلدون 
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وتعرف ببساطة guU‏ من المشجعين باسم «وهمبلدون», وهي أقدم بطولات التنس 
الأربع الكبرىء وهي واحدة من أرقى الأحداث الرياضية في العام وقد تم تنظيمها 
من قبل نادي All England Lawn Tennis Club (AELTC)‏ والذي يُعد مؤسمسة 
رياضية وثقافية عالمية منذ عام MW‏ 

بطل البطولات: 

إن منظمي بطولات وهبلدونء AELTCK5‏ لديهم هدف بسيط: فهم يريدون 
استضافة أفضل بطولات التنس في العالم كل عام - i Jo JS‏ وبكل مقياس. 

والدافع وراء هذا الالتزام ليس مجرد الكبرياء؛ كما أن لديها أساسا تجاريًا. فقد تم بناء 
علامة ويمبلدون (Wimbledon)‏ التجارية على مكانتها الرائدةء وهذا ما يجذب كلا من 
المعجبين والشركاء. وتسعى أفضل المنظمات الإعلامية في العام وأعظم الشركات - ها في ذلك 
IBM‏ - أن تكون مرتبطة مع ويهمبلدون على وجه التحديد بسبب سمعتها للتميز. 

ولهذا السببء يعد الحفاظ على هيبة البطولة من أهم أولويات -AELTC‏ ولكن 
هناك طريقتان فقط oe‏ أن تتحكم فيهما المنظمة مباشرة في كيفية النظر إلى بقية 
البطولات من قبل بقية العام. 

الأولى والأكثر أهمية هي: توفير تجربة رائعة للاعبين والصحفيين والمتفرجين 
المحظوظين ها يكفي لزيارة ومراقبة ملعب التنس. وتتمتع AELTC‏ بخبرة كبيرة في 
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هذا المجال. ففي عام AAW‏ أقامت منافسة مثيرة ورائعة على مدار أسبوعين في أجواء 
شاعرية: التنس في الريف الإنجليزي. 

والثانية هي: الحضور للبطولة عبر الإنترنت» والذي يتم تسليمه عبر موقع الويب 
wimbledon.com‏ وتطبيقات الجوال وقنوات التواصل الاجتماعي. وهذا التطور المستمر 
لهذه المنصات الرقمية هو نتيجة شراكة مدتها ۲ Úle‏ بين IBMs AELTC‏ 

ويوضح Mick Desmond‏ المدير التجاري والإعلامي في AELTC‏ قائلًا: «عندما 
تشاهد وهبلدون على GALII‏ فإنك تشاهده من خلال عدسة المذيع. ونحن نفعل كل ما 
في وسعنا لمساعدة شركائنا في وسائل التواصل على تقديم أفضل عرض ممكن. ويختلف 
النظام الرقمي؛ فهو نظامنا الأساسي. حيث يمكننا التحدث مباشرة مع المعجبين لديناء لذلك 
فمن المهم أن نقدم لهم أفضل تجربة ممكنةء وإذا أردنا تعزيز علامتنا التجاريةء فنحن 
بحاجة إلى أن يشاهدوا تجربتنا الرقمية كمركز رقم واحد متابعة البطولة على الإنترنت“. 

ولذا؛ فقد استهدفت AELTC‏ جذب ۷۰ مليون زيارة, و۲۰ مليون جهاز فرید 
As‏ ملايين متابع خلال أسبوعين من بطولة Y VO‏ وكان الأمر متروكًا لشركتي IBM‏ و 
AELTC‏ لإيجاد طريقة للتوصيل. 

نقل تجربة رقمية فريدة: 

شرعت AELTCs IBM‏ في إعادة تصميم كاملة للمنصة الرقميةء وذلك باستخدام 
معرفتهم الوثيقة بجماهير البطولات بهدف تطوير تجربة مصممة خصيصًا لجذب 
مشجعي التنس من جميع أنحاء العام والإبقاء عليهم. 

تقول Alexandra Willis‏ رئيس قسم ال محتوى الرقمي في :AELTC‏ «لقد أدركنا 
أنه على الرغم من الأهمية المتزايدة للهاتف المحمولء فإن ۸٠‏ من زوارنا يستخدمون 
أجهزة الحاسب المكتبية للوصول إلى موقعنا على الويب» وكان التحدي الذي واجهنا 
لعام ۲١٠١‏ هو كيفية تحديث خصائصنا الرقمية ASU‏ مع عام متنقلء مع توفير 
أفضل تجربة ممكنة لسطح المكتب على الإطلاق. وقد أردنا موقعنا الجديد أن يستفيد 
إلى أقصى حد من تلك الشاشة الكبيرة, وهنح مستخدمي سطح المكتب أغنى تجربة 
ممكنة فيما يتعلق با مشاهد المرئية ومحتوى الفيديو ع الي الوضوح - بينما يتفاعلون 
أيضًا ويتكيفون بسهولة مع أشكال الأجهزة اللوحية أو الهواتف المحمولة الأصغر». 

وتضيف: GO»‏ ركزنا تركيراً عاليًا على وضع محتوى في السياق» أي تكامل المقالات 
مع الصور ومقاطع الفيديو والإحصاءات ومقتطفات المعلومات ذات الصلةء وتبسيط 
التنقل بحيث يمكن للمستخدمين الانتقال بسلاسة إلى المحتوى الأكثر أهمية لهم». 
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وبالنسبة لأجهزة المحمولء فقد أدرك الفريق أن إتاحة اتصالات 4G‏ بسعة تحميلية عالية 
يعني أن موقع الويب للمحمول سيصبح أكثر شعبية من أي وقت ughe‏ كما سيضمن سهولة 
الوصول إلى جميع محتوى الوسائط الغنية. وفي الوقت نفسه» تم تحسين تطبيقات المحمول 
في البطولات بإشعارات لنتائج المباريات في وقت حدوثهاء بل وهمكنه ا أيضًّا تقديم التحية 
للزوار أثناء مرورهم عبر المحطات في الطريق إلى الملاعب. 

كما قام الفريق ببناء مجموعة خاصة من المواقع الإلكترونية لأهم جماهير للعبة التنس» 
وهي اللاعبين أنفسهم؛ حيث قاموا - باستخدام تقنية *Bluemix‏ /188*- ببناء تطبيق ويب 
آمن يوفر للاعبين Lose‏ شخصيًا لحجوزاتهم في الملعب» وتنقلاتهم, وأوقات اللعبء بالإضافة 
إلى مساعدتهم في مراجعة أدائهم بالوصول إلى إحصائيات كل مباراة لعبوها. 

تحويل البيانات إلى صورة مرئية - والصورة المرئية إلى قصة: 

ولتزويد منصاتها الرقمية با محتوى الأكثر dU]‏ فقد استفاد الفريق من ميزة فريدة, 
وهي وصوله إلى البيانات الخاصة بكل تسديدة في كل مباراة خلال البطولة في وقت حدوثها. 
وعلى مدار أسبوعين من بطولة وهبلدونء قام Gasos fmd EA‏ بجمع ما يقرب من 7,6 
مليون نقطة بيانات» وتتبع نوع اللقطة» والإستراتيجيات» ونتائج كل نقطة. 

ويتم جمع هذه البيانات وتحليلها في وقت حدوثها لإنتاج إحصاءات لمعلقي التلفاز 
والصحفيين وكذلك لفريق التحرير الخاص بالمنصة الرقمية. 

تقول :Alexandra Willis‏ ”منحتنا شركة IBM‏ هذا العام ميزة لم نكن نملكها من 
قبلء وذلك باستخدام تقنية تدفق البيانات لتزويد فريق التحرير لدينا بنظرة فورية 
للمعالم البارزة والأخبار العاجلة“. 

وتضيف: ”وقد راقب النظام BEG‏ تيارات البيانات القادمة من جميع الملاعب 
التسعة ås‏ وكلما حدث شيء مهم مثل تحقيق Sam Groth‏ لثاني أسرع خدمة في 
البطولات» يتم إخبارنا بذلك على الفور. وخلال ثوانء تمكنا من جلب هذه الأخبار إلى 
جمهورنا الرقمي ومشاركتها على الشبكات الاجتماعية لزيادة عدد الزيارات إلى موقعنا. 

”وقد كانت القدرة على التقاط اللحظات ال مهمة والكشف عن الروايات الصريحة 
في البيانات» بشكل أسرع من أي شخص آخرء أمرًا أساسيًا. فإذا كنت ترغب في تجربة 
انفعالات بطولة The livehips‏ فإن أفضل ما يمكن أن يكون موجودًا في شخص ما هو 
متابعة الحدث ""wimbledon.com ,Je‏ 
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استغلال قوة اللغة الطبيعية: 

وقد خضعت للتجربة هذا العام قدرة 5,51« وهي استخدام تقنيات معالجة اللغات 
الطبيعية NLP‏ الخاصة بشركة IBM‏ وذلك للمساعدة في تطوير المكتبة الضخمة لتاريخ 
التنس في AELTC‏ للحصول على معلومات ذات سياق جيد ومثيرة للاهتمام. وقد قام 
الفريق بتدريب IBM Watson " Engagement Advisor‏ على استيعاب هذه المجموعة 
الغنية من البيانات غير الهيكلية واستخدامها للرد على الاستفسارات من المكتب الصحفي. 

كما تم ربط نفس واجهة معالجة اللغات الطبيعية Us] (NLP)‏ بقاعدة بيانات منظمة 
شاملة لإحصائيات المطابقة. والتي يعود تاريخها إلى أول بطولة والتي كانت عام AAW‏ 
والذي يجيب بشكل فوري على كل من الأسئلة الأساسية والاستفسارات الأكثر تعقيدًا. 

يقول :Mick Desmond‏ «وقد أظهرت تجربة Watson‏ قدرًا DS‏ من الإمكانات. 
وفي العام القادم» وكجزء من عملية التخطيط السنوي للابتكار فإننا سننظر في LAS‏ 
استخدامنا لها على نطاق أوسع - حيث نسعى في النهاية إلى منح المعجبين فرصة أكبر 
للوصول إلى هذا المصدر الغني بمعلومات التنس بشكل مذهل». 

الارتقاء للسحاب: 

لقد تمت استضافة البيئة الرقمية بالكامل من قبل IBM‏ في Cloud Hybrid‏ الخاص 
بها. حيث استخدمت IBM‏ تقنيات النمذجة المتطورة للتنبؤ بالذروات في الطلب على 
أساس الجدول الزمني» وشعبية كل لاعب» والوقت من اليوم» والعديد من العوامل 
الأخرى -مما مكنها من تخصيص موارد السحابة بشكل ديناميكي لكل جزء من المحتوى 
الرقمي وضمان تجربة سلسة ملايين الزائرين حول العام. 

وبالإضافة إلى منصة السحابة الخاصة القوية التي دعمت البطولة لعدة سنوات» استخدمت 
ا أيضًا سحابة *SofiLayer‏ المنفصلة لاستضافة مركز قيادة وهبلدون الاجتماعي وأيضًا 
توفير سعة إضافية لتكميل بيئة السحابة الرئيسة خلال أوقات الذروة للطلب. 

وتعتبر مرونة بيئة السحابة أمرًا أساسيًّ؛ نظرًا لأن المنصات الرقمية للبطولة تحتاج 
إلى أن تكون قادرة على التوسع بكفاءة من خلال عامل يزيد عن ٠٠١‏ في غضون أيام مع 
تزايد الفائدة قبل المباراة الأولى في املعب الرئيس. 

المحافظة على وهبلدون آمنة ومُحْكَمَة: 

يُعد الأمان على الإنترنت هو مصدر القلق الرئيس في الوقت الحاضر لجميع 
المنظمات. وبالنسبة للفعاليات الرياضية الكبرى على وجه الخصوصء فإن سمعة 
العلامة التجارية هي كل شيء - وبينما يراقب العالم. فإنه من eal!‏ بشكل خاص تجنب 
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الوقوع كضحية سهلة igyal‏ الإلكترونية .cyber-crime‏ ولهذه الأسباب» يلعب الأمان 
دورًا حيويًا في شراكة IBM‏ مع -AELTC‏ 

والجدير بالذكر أنه خلال الأشهر الخمسة الأولى من عام ۲١٠١‏ اكتشفت أنظمة أمان 
6 زيادة بنسبة € في الأحداث الأمنية على البنية التحتية wimbledon.com‏ مقارنةٌ 
بالفترة نفسها من عام Y «VE‏ ونظرًا للتهديدات الأمنية - وخاصة هج مات الحرمان من 
الخدمة الموزعة (DDoS)‏ - أصبحت 18 أكثر انتشارًا بشكل مستمرء حيث تعمل على زيادة 
تركيزها من أجل توفير مستويات رائدة في صناعة الأمن للمنصة الرقمية الكاملة ل -AELTC‏ 

وقد مكنت مجموعة كأملة من منتجات 181/1 الأمنية مما في ذلك IBM QhRadar* SIEM‏ 
IBM Preventia Intrusion Prevention‏ بطولة هذا العام من العمل بسلاسة وأمانء 
ومنصة رقمية لتقديم تجربة مستخدم عالية الجودة في جميع الأوقات. 

أسر القلوب والعقول: 

كان نجاح النظام الرقمي الجديد لعام ٠١10‏ - بدعم من تقنيات سحابة IBM‏ 
وتقنيات التحليلات وتقنيات الجوال وبالإضافة إلى التقنيات الاجتماعية والأمنية - فوريًا 
وكاملا. وم يتم تحقيق أهداف إجمالي الزيارات والزوار الفريدين فحسبء بل تم 
تجاوزها أيضًا. إن تحقيق VY‏ مليون زيارة O£Y‏ مليون مشاهدة من ۲۱,۱ مليون جهاز 
فريد من نوعه يُظهر نجاح المنصة في جذب جمهور أكبر من أي وقت ugao‏ وإبقاء 
هؤلاء المشاهدين مشاركين طوال البطولة. 

تقول :Alexandra Willis‏ ”بشكل عام حققنا زيادة في الزيارات بنسبة AY‏ من 
أجهزة تجاوزت الأجهزة في عام ۲١٠١‏ بنسبة d ijo HYY‏ بعام VVE‏ وكان النمو في 
استخدام wimbledon.com‏ على الجوّال أكثر إثارة للإعجاب“. وتضيف قائلة: ”لقد 
شهدنا نموا بنسبة ×١١‏ في الأجهزة الفريدة على الجوّال ونهوًا بنسبة ^43 في إجمالي 
الزيارات ونمو بنسبة 2۷۹ في إجمالي عدد مشاهدات الصفحة“. 

ويختتم Mick Desmond‏ قائلًا: jl»‏ النتائج أنه في عام Y YO‏ فزنا في الاستحواذ 
على قلوب وعقول المشجعين. فقد يكون لدى الناس الصحف المفضلة ومواقع الويب 
الرياضية التي يزورونها لمدة 0٠‏ أسبوعًا من السنة - غير أنهم بدلا من ذلك قد جاءوا 
إلينا مدة أسبوعينء وهذا دليل على الجودة المطلقة للتجربة التي يمكن أن نقدمها - 
واستغلال ميزاتنا الفريدة لجعلهم أقرب إلى العمل من أي قنوات تواصل أخرى. وقد 
ساعدت القدرة على التقاط وتوصيل المحتويات ذات الصلة فور وقوعها معجبينا على 
تحقيق مزيد من الاستمتاع بالبطولات أكثر من أي وقت Aha‏ 
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أسئلة للمناقشة: 
-١‏ كيف استخدمت وهبلدون قدرات التحليلات لتعزيز تجربة المشاهدين؟ 
-Y‏ ما هي التحديات والحل المقترح والنتائج التي حصلوا عليها؟ 
Source: IBM Case Study. Creating a unique digital experience to capture the‏ 


moments that matter. http://www-03.ibm.com/software/businesscasestudies/us/en/ 


corp?synkey-D140192K15783Q68 (accessed May 2016). 

تطبيقات تحليل المشاعر: 

بالمقارنة مع الأساليب التقليدية لتحليل المشاعر, والتي كانت تستند إلى مسح أو مجموعة 
تركيز مركزة ومكلفة وتستهلك الكثير من الوقت (وبالتالي مدفوعة من عينة صغيرة من المشاركين)» 
فإن الوجه الجديد لتحليل المشاعر القائم على تحليلات النصوص هو كاسر للحد. تعمل الحلول 
الحالية على جعل عمليات جمع البيانات وترشيحها وتصنيفها وتجميعها على نطاق واسع عملية 
di‏ وذلك عبر تقنية البرمجة معالجة اللغات الطبيعية NLP‏ وتقنيات التنقيب في البيانات التي 
dobes‏ مع كل من المعلومات الواقعية والذاتية. وقد يكون تحليل المشاعر التطبيق الأكثر شيوعًا 
لتحليلات النصوصء والاستفادة من مصادر البيانات Jio‏ التغريدات» ومشاركات «Facebook‏ 
والمجتمعات على الإنترنت» ولوحات المناقشةء وسجلات الويب» ومراجعات المنتجات. وسجلات 
مركز الاتصال والتسجيلات» ومواقع تقييم المنتجات. وغرف الدردشة: ومنافذ مقارنة الأسعار 
وسجلات محرك البحث ومجموعات الأخبار. وتهدف التطبيقات التالية لتحليل المشاعر إلى 
توضيح القوة والتغطية الواسعة لهذه التقنية. 

صوت العميل (VOC)‏ يعتبر صوت العميل (VOC)‏ جزءًا Y‏ يتجزأ من أنظمة إدارة علاقات 
العملاء التحليلية CRM‏ وأنظمة إدارة العملاء. وباعتبار تحليل المشاعر أداة تمكين VOCI‏ 
فإنه يمكن لتحليل المشاعر الوصول إلى مراجعات منتجات وخدمات الشركة (سواء بشكل مستمر 
أو بشكل دوري) لفهم وإدارة شكاوى العملاء ومدحهم بشكل أفضل. فعلى سبيل JEL‏ قد 
تكتشف شركة إعلانات / تسويقء go‏ متحركة أو مشاعر سلبية تجاه فيلم على وشك الافتتاح في 
المسارح (استنادًا إلى مقطوراتها (trailers‏ وتقوم بتغيير تركيبة المقطورات trailers‏ وإستراتيجية 
الإعلان بسرعة (على جميع وسائل التواصل) للتخفيف من تأثير السلبية. وبامثل» يمكن لشركة 
برمجيات أن تكتشف الطنين السلبي فيما يتعلق بالثغرات الموجودة في منتجها الذي تم إطلاقه 
حديثًا في وقت مبكر ها فيه الكفاية؛ لإصدار رقع وتصحيحات سريعة للتخفيف من حدة الموقف. 
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وفي كثير من الأحيان» يكون تركيز صوت العميل (VOC)‏ على العملاء الأفرادء واحتياجاتهم 
المتعلقة بالخدمات والدعم ورغباتهم ومشكلاتهم. ويقوم VOC‏ بتجميع البيانات من ا مجموعة 
الكاملة لنقاط اتصال العملاء Le‏ في ذلك رسائل البريد الإلكتروني والاستطلاعات وتسجيلات مركز 
الاتصال / التسجيلات» وترحيل وسائل التواصل الاجتماعي» ومطابقة أصوات العملاء مع المعاملات 
(الاستفسارات والمشتريات والعوائد)» والملفات الشخصية للعملاء الفردية التي تم التقاطها في 
مؤسسة أنظمة التشغيل. ويُعد VOC‏ والتي يقوم تحليل المشاعر بقيادتهاء عنصرًا أساسيًا في 
مبادرات إدارة تجربة العملاء والذي هثل الهدف في إنشاء علاقة ودية مع العميل. 

صوت السوق (VOM)‏ يدور VOM‏ حول فهم الآراء والاتجاهات المجمعة. فهي تتعلق 
معرفة ماهية أصحاب المصلحة - العملاء العملاء المحتملين» المؤثرينء Gl‏ كان - بشأن منتجاتك 
وخدماتك (ومنافسيك). ويساعد تحليل VOM‏ - الذي يتم إجراؤه جيدًا - الشركات على تطوير 
الذكاء التنافسي وتطوير المنتجات ووضعها. 

صوت الموظف :(VOE)‏ كان VOE‏ تقليديًا يقتصر على دراسة رضا الموظفين. وتُّعد تحليلات 
النص بشكل عام (وتحليل المشاعر على وجه الخصوص) تمكينًا كبيرا لتقييم ۷0۴. كما يعد استخدام 
البيانات النصية الغنية المعتمدة على الرأي طريقة فعالة وكفء للاستماع إلى ما يقوله الموظفون. 
وكما نعلم Lear‏ فإن الموظفين السعداء يعملون على تمكين جهود تجربة العملاء وتحسين رضاهم. 

إدارة العلامات التجارية: تركز إدارة العلامة التجارية على الاستماع إلى وسائل التواصل 
الاجتماعي» حيث هكن لأي شخص (العملاء السابقين / الحاليين / المحتملين» وخبراء الصناعة, 
والسلطات الأخرى) نشر الآراء التي يمكن أن تضر بسمعتك أو تعززها. ويقدم عدد من الشركات 
المبتدئة التي تم إطلاقها Éo‏ خدمات إدارة العلامات التجارية القائمة على التحليلات للآخرين. 
وتعد إدارة العلامة التجارية هي المنتج» والشركة aa)‏ من العملاء) هي التي تركز عليها. فهي 
تحاول تشكيل المفاهيم بدلا من إدارة الخبرات باستخدام تقنيات تحليل المشاعر. 

الأسواق AJU‏ كان التنبؤ بالقيم المستقبلية للأفراد (أو مجموعة من الأسهم) مشكلة مثيرة 
للاهتمام ويبدو أنها غير قابلة للحل. وما يجعل السهم (أو مجموعة من الأسهم) يتحرك صعودًا 
أو هبوطًا هو أي شيء غير أنه يتطلب إدراك دقيق. ويعتقد الكثيرون أن سوق الأسهم مدفوعة 
في معظمها بالمشاعرء مما يجعلها غير عقلانية (خاصة بالنسبة لحركات الأسهم قصيرة الأجل). 
ولذلك؛ فقد اكتسب استخدام تحليل المشاعر في الأسواق المالية شعبية كبيرة. ويبدو التحليل الآلي 
Jab‏ السوق باستخدام وسائل التواصل الاجتماعي والأخبار والمدونات ومجموعات النقاش طريقة 
مناسبة لحساب تحركات السوق. فإذا تم ذلك بشكل صحيح» فإنه يمكن أن يحدد تحليل المشاعر 
تحركات الأسهم قصيرة الأجل بناءً على الضجة في السوق» مما قد يؤثر على السيولة والتداول. 
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السياسة: كما نعلم جميعًاء فإن الآراء مهمة للغاية في السياسة. ونظرًا لأن النقاشات السياسية 
تهيمن عليها الاقتباسات والسخرية والإشارات المعقدة للأشخاص والمنظمات والأفكار, فإن السياسة 
هي واحدة من أصعب المجالات التي يمكن أن تكون مثمرة لتحليل المشاعر. ومن خلال تحليل 
المشاعر في المنتديات الانتخابية: هكن للمرء أن يتوقع من هو أكثر احتمالًا للفوز أو الخسارة. كما 
يمكن أن يساعد تحليل المشاعر في فهم ما يفكر فيه الناخبون ويمكنه توضيح موقف المرشح بشأن 
القضايا. وبالإضافة إلى ما سبق» فإن تحليل المشاعر يمكنه أن يساعد المنظمات السياسية والحملات 
ومحللي الأخبار على فهم أفضل للقضايا والمواقف الأكثر أهمية بالنسبة للناخبين. وقد تم تطبيق 
التقنية بنجاح من قبل كلا الطرفين في الحملات الانتخابية الرئاسية الأمريكية لعامي ۲۰۰۸ Y M5‏ 

المخابرات الحكومية: المخابرات الحكومية هي تطبيق آخر تم استخدامه من قبل وكالات 
المخابرات. فعلى سبيل JEBI‏ تم اقتراح إمكانية مراقبة jalas‏ الزيادة في الاتصالات العدائية أو 
السلبية. ويمكن لتحليل المشاعر أن يسمح بالتحليل التلقائي للآراء التي يقدمها الأشخاص حول 
مقترحات السياسات أو التنظيم الحكومي المعلقة. وعلاوةً على ذلك فقد تكون مراقبة الاتصالات 
لاكتشاف ارتفاع ا مشاعر السلبية مفيدة لوكالات مثل وزارة الأمن الداخلي. 

مجالات أخرى مثيرة للاهتمام: يمكن استخدام مشاعر العملاء لتصميم مواقع التجارة الإلكترونية 
بشكل أفضل (اقتراحات المنتج, الإعلان عن البيع / البيع المتقاطع)» ووضع الإعلانات في مكان أفضل 
(مثل: وضع إعلانات ديناميكية للمنتجات والخدمات التي تنظر في المشاعر في الصفحة التي يقوم 
المستخدم بتصفحها) وإدارة الرأي أو مراجعة محركات البحث الموجه (أي موقع ويب لتجميع 
الآراءء كبديل gSlsl‏ مثل Epinions‏ وتلخيص ملاحظات المستخدمين). ويمكن أن يساعد تحليل 
المشاعر على تصفية البريد الإلكتروني من خلال تصنيف وترتيب الرسائل حسب أولوياتها Fiad)‏ يمكنه 
اكتشاف رسائل البريد الإلكتروني السلبية وإرسالها إلى مجلد مناسب)ء بالإضافة إلى تحليل الاقتباس» 
حيث ASe‏ تحديد ما إذا كان المؤلف يستشهد بجزء من العمل كدليل دامغ أو بحث مرفوض. 








عملية تحليل المشاعر: 

لا توجد عملية قياسية متاحة بسهولة لإجراء تحليل المشاعرء وذلك بسبب تعقيد المشكلة 
(المفاهيم الأساسية: التعبيرات في النص السياق الذي يتم فيه التعبير عن النص» إلخ). ومع ذلكه 
stus‏ على العمل المنشور في مجال تحليل الحساسية حتى II‏ (على JS‏ من طرق البحث ومجموعة 
(Olishi‏ فإن العملية تبدو متعددة النقاط وبسيطة ومنطقية. وكما هو موضح في الشكل )3-0( 
والذي هو عبارة عن منهجية مناسبة لتحليل المشاعر, فإن هذه الخطوات المنطقية تكرارية (أي ردود 
الفعل» التصحيحات, التكرارات هي جزء من عملية الاكتشاف) وتجريبية في الطبيعة وبمجرد الانتهاء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري evy‏ 


الفصل الخامس 


من الجمع والتركيب» فإنها تكون قادرة على إنتاج البصيرة المرغوبة حول الآراء في مجموعة النص. 

- الخطوة -١‏ الكشف عن المشاعر: بعد استرجاع الوثائق النصية وإعدادهاء فإن المهمة الرئيسة 
الأولى في تحليل الحساسية هي الكشف عن الموضوعية. والهدف هنا هو التفريق بين الحقيقة 
والرأي» والتي يمكن اعتبارها تصنيف نص موضوعي أو GR‏ كما يمكن تمييزها بحساب 0-8 
(الموضوعية Objectivity‏ - تناقض الموضوعية Subjectivity Polarity‏ والتي هكن تمثيلها 
بقيمة رقمية تتراوح من ٠‏ إلى .)١‏ فإذا كانت قيمة الموضوعية قريبة من A‏ فلا يوجد رأي لي 
(أي أنها حقيقة)؛ ولذلك ترجع العملية وتستخرج البيانات التالية للنص لتحليلها. Éole‏ ما 
يستند اكتشاف الرأي على دراسة الصفات في النص. فعلى سبيل JELI‏ هكن تحديد تناقض ”ما 
يعد عملا "lily‏ بسهولة نسبية بالنظر إلى الصفة. 

- الخطوة -Y‏ تصنيف التناقض N-P‏ المهمة الرئيسة الثانية هي تصنيف التناقض. وبالنظر إلى 
نص معين برأي quis‏ فإن الهدف هو تصنيف الرأي على أنه يندرج تحت إحدى عاطفتين 
متعارضتین» أو تحديد موقعه على الدوام بين هاتين المتناقضتين (2008 (Pang & Lee,‏ فعند 
النظر إليه على أنه عنصر ثنائ» فإن تصنيف الأقطاب هو مهمة التصنيف الثنائي لوضع علامة 
على وثيقة الرأي كإعراب إما عن رأي إيجابي شامل أو سلبي شامل (مثل: الإعجاب أو الإبهام). 
وبالإضافة إلى تحديد تناقض N-P‏ فإنه يجب أيضًا أن يكون المرء Liiga‏ بتحديد قوة المشاعر 
(على عكس الإيجابي فقطء قد يتم التعبير عنه على أنه أقل من المعتاد mildly‏ أو معتدل 
moderately‏ أو 55-3« أو gll‏ للغاية). وقد تم إجراء معظم هذا البحث حول مراجعات 
المنتجات أو الأفلام حيث تكون تعريفات ”الإيجابية“ و“السلبية“ واضحة SU‏ وهناك بعض 
المهام الأخرى» مثل تصنيف الأخبار على أنها ”جيدة“ أو ”سيئة“. فعلى سبيل «JUL‏ قد تحتوي 
إحدى المقالات على أخبار سلبية بدون استخدام أي كلمات أو عبارات ذاتية بشكل صريح. 
ge‏ على ذلك تظهر هذه الفئات bole‏ مختلطة عندما تعبر الوثيقة عن المشاعر الإيجابية 
والسلبية. ades‏ فإن هذه المهمة يمكنها تحديد المشاعر الرئيسة (أو المسيطرة) للوثيقة. 
ومع ذلك فإنه بالنسبة للنصوص المطولة» قد يلزم القيام ههام التصنيف على عدة مستويات: 
المصطلح. العبارة. الجملةء ورها مستوى الوثيقة. وبالنسبة لهؤلاء فإنه من الشائع استخدام 
مخرجات مستوى واحد كمدخلات للطبقة الأعلى التالية. وفي القسم التالي سوف نتناول شرح 
العديد من الطرق المستخدمة لتحديد التناقض وكذلك أوجه القوة في التناقض. 

- الخطوة *- تحديد الهدف: الهدف من هذه الخطوة هو تحديد هدف المشاعر fll‏ عنها بدقة 
(على سبيل JÈL‏ شخص,» qiia‏ حدث). وتعتمد صعوبة هذه المهمة بشكل كبير على مجال 
التحليل. وعلى الرغم من أنه من السهل Bale‏ تحديد الهدف بدقة لمراجعات المنتج أو الفيلم 
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نظرًا لأن ا مراجعة مرتبطة مباشرة بالهدفء فقد يكون الأمر so‏ جدًا في النطاقات الأخرى. فعلى 
سبيل JEU‏ لا يحتوي النص طويل Að‏ مثل صفحات الويب وامقالات الإخبارية والمدؤنات Ul»‏ 
على موضوع محدد مسبقًا تم تعيبنه» وكثيرا ما يذكر العديد من الموضوعات. quil‏ يمكن استنتاج 
أي منها على أنه الهدف. وف بعض الأحيان يكون هناك أكتر من هدف واحد في جملة امشاعرء 
وهذا هو الحال في النصوص المقارنة؛ حيث تقوم جملة نسبية ذاتية بطلب الأشياء حسب ترتيب 
التفضيل - مثل: ”هذا الحاسب المحمول أفضل من الحاسب المكتبي الخاص بي". ويمكن تحديد 
هذه الجمل باستخدام الصفات والحالات المقارنة )351 أقلء (abel «Las‏ والصفات الفائقة 
(معظم» والأقل والأفضل). وغيرها من الكلمات (مثل: نفس الشيء (LÉS J c AL‏ وبمجرد 
استرداد الجملء يمكن وضع الأشياء بترتيب أكثر تمثيلًا لمزاياهاء كما هو موضح في النص. 

- الخطوة £- الجمع والتجميع: بمجرد تحديد ومعالجة مشاعر جميع نقاط البيانات النصية في 
الوثيقة» يتم تجميعها وتحويلها في هذه الخطوة إلى قياس واحد لكل الوثيقة. وقد يكون هذا 
التجميع بسيطًا Jis‏ تلخيص نقاط الضعف ونقاط القوة لكل النصوص, أو معقدًا مثل استخدام 
تقنيات التجميع الدلالي من معالجة اللغات الطبيعية NLP‏ للوصول إلى المشاعر النهائية. 
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طرق تحديد التناقض: 
كما ذكرنا في القتسم السابقء هكن تحديد التناقض على مستوى الكلمة أو العبارة أو الجملة 
أو الوثيقة. ويُعد المستوى الأكثر دقة لتحديد التناقض هو على مستوى الكلمة. وجرد أن يتم 
تحديد التناقض على مستوى الكلمة, فإنه يمكن ضمها إلى المستوى الأعلى التالي ثم إلى ا مستوى 
التالي حتى يتم الوصول إلى مستوى التجميع المطلوب من تحليل ا مشاعر. ويبدو أن هناك تقنيتين 
سائدتين تُستخدمان لتحديد التناقض على مستوى الكلمة / المصطلح ولكل منهما مميزاته وعيوبه: 
-١‏ استخدام المعجم كمكتبة مرجعية (ويتم تطويره إما يدويًا أو DIAB‏ بواسطة فرد لمهمة 
محددة أو قد يتم تطويره بواسطة مؤسسة للاستخدام العام). 
-Y‏ استخدام مجموعة من وثائق التدريب كمصدر للمعرفة حول تناقض المصطلحات في نطاق 
معين (أي استحداث نماذج تنبؤية من الوثائق النصية المعترف بها). 


استخدام المعجم: 

المعجم هو في الأساس كتالوج لكلمات لغة معينة ومرادفاتها ومعانيها. وهناك العديد من 
ا معاجم ذات الأغراض العامة التي تم إنشاؤها للغة الإنجليزية» بالإضافة إلى وجود معاجم للعديد 
من اللغات الأخرى. وتستخدم معاجم الأغراض العامة في الغالب لإنشاء مجموعة متنوعة من 
المعاجم ذات الأغراض الخاصة لاستخدامها في مشاريع تحليل المشاعر. ولعل المعجم الأكثر 
انتشارًا للأغراض العامة هو WordNet‏ والذي تم إنشاؤه في جامعة Princeton‏ والذي تم 
توسعته واستخدامه من قبل العديد من الباحثين والممارسين لأغراض تحليل المشاعر. وكما هو 
موضح في موقع WordNet‏ على الويب (wordnet.princeton.edu)‏ فهو قاعدة معجمية كبيرة 
للغة الإنجليزية: Le‏ في ذلك الأسماء والأفعال والصفات والظروفء والتي تم ضمها في مجموعات 
من المرادفات المقربة (ويطلق عليها synsets‏ والتي يعبر كل منها عن مفهوم متميز. وتترابط 
٤ء‏ عن طريق وسائل مفاهيمية دلالية وعلاقات معجمية. 

وقد تم إنشاء ملحق gio‏ للاهتمام WordNet exul‏ بواسطة Sebastiani ; Esuli‏ )2006( 
حيث قاما بإضافة تناقض (إيجابي - سلبي؛ (P-N‏ وموضوعية (ذاتي - موضوعي؛ (S-O‏ لكل 
مصطلح في المعجم. ولتسمية كل lhaa‏ يقومان بتصنيف المجموعة من اللمترادفات التي ينتمي 
إليها هذا المصطلح باستخدام مجموعة ثلاثية التصنيف (وهي مقياس يربط كل موضوع Gle‏ 
واحدًا من ثلاثة عناوين)؛ وكل واحد منهم قادر على تقرير ما إذا كانت synset‏ إيجابية أم سلبية 
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أم موضوعية. وتتراوح الدرجات الناتجة من ٠,١‏ إلى ds‏ مما يعطي تقبيمًا متدرجًا لخصائص 
المصطلحات المتعلقة بالرأي. ويمكن تلخيصها بصورة مرئية كما في الشكل .)٠١-0(‏ وتمثل gel‏ 
المثلث التصنيفات الثلاثة (الإيجابية والسلبية وا موضوعية). ويمكن أن يتم تحديد موقع المصطلح 
في هذه المساحة كنقطة. تمثل المدى الذي ينتمي إليه كل واحد من هذه التصنيفات. 


ويتم استخدام منهجية توسيع مماثلة لإنشاء SentiWordNet‏ وهو معجم متاح للجمهور 
تم تطويره خصيصًا لأغراض التنقيب في الرأي (تحليل المشاعر). وَيُّعيّن SentiWordNet‏ لكل 
مجموعة من الدرجات الثلاث من معنويات :WordNet‏ الإيجابية والسلبية والموضوعية. ويمكن 
الاطلاع على المزيد حول SentiWordNet‏ في -sentiwordnet.isti.cnr.it‏ 


وهناك gado‏ آخر ل WordNet‏ هو WordNet-Affect‏ وقد تم تطويره بواسطة كل من 
Valituttis Strapparava‏ )2004( حيث Ul‏ بتصنيف معادلات WordNet‏ باستخدام تسميات 
فعالة تمثل فئات عاطفية مختلفة مثل العاطفة والحالة الإدراكية والموقف والشعور. كما استخدما 
WordNet‏ أيضًا بشكل مباشر في تحليل المشاعر. pë aas‏ كل من Hovys Kim‏ )£2004 و 
Chengs Hus Liu‏ )2005( بتطوير معاجم للمصطلحات الإيجابية والسلبية من خلال البدء 
ddl‏ صغيرة من مصطلحات ”البذور“ للمترادفات المتعارف عليها (مثل: (nice, like, love‏ وبعد 
ذلك استخدما خاصيتي تضاد وترادف المصطلحات لتجميعها في أي فئة من فئات التناقض. 
تي (S)‏ 

















شكل :٠١-0‏ تمثيل بياني لعلاقتي تناقض کل من P-N‏ و5-0 


استخدام مجموعة من وثائق التدريب: 
من الممكن إجراء تصنيف للمشاعر باستخدام التحليل الإحصائي وأدوات التعليم الآلي التي 
تتمتع بميزة كمية الموارد الضخمة من الوثائق المتاحة (يدويًا عن طريق الحواشي أو باستخدام 
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نظام نجمة / نقطة). وقد تم استخدام مواقع الويب .C-NET 5 Amazon Jis‏ وBay¢‏ و 
Internet Movie Databases .RottenTomatoes‏ على نطاق واسع كمصادر للبيانات المشروحة. 
من أجل استعراض المنتجات. ويوفر نظام النجمة (أو الطماطم (Lo‏ علامة واضحة عن التناقض 
الكامل في الاستعراض ككلء وغالبًا ما يتم استخدامه كمعيار ذهبي لتقييم الخوارزمية. 
وتنوفر مجموعة متنوعة من البيانات النصية المصنفة يدويًا من خلال جهود التقييم مثل مؤتمر 
NII Test Collections :RETRIETER‏ لأنظمة IR‏ وعبر منتدى تقييم اللغات. وتنتج هذه 
المجموعة من البيانات Bagr‏ غالبًا ما تكون بمثابة معيار في مجتمع التنقيب في النص» ا في ذلك 
لباحثي تحليل المشاعر. كما أنتج الباحثون الفرديون ومجموعات البحث العديد من مجموعات 
البيانات المثيرة. وتعرض الفكرة التطبيقية AEG (Y-0)‏ ببعضها. وبمجرد الحصول على مجموعة 
بيانات duas‏ مصنفة بالفعلء GB‏ يمكن استخدام مجموعة متنوعة من النمذجة التنبؤية وغيرها 
من خوارزميات تعلم الآلة لتدريب مصنفي المعنويات. وتتضمن بعض الخوارزميات الأكثر شيوعًا 
المستخدمة لهذه المهمة الشبكات العصبية الاصطناعيةء وآلة المتجهات الداعمةء والجار الأقرب» 
والخلايا البسيطة» وأشجار القرارء وتعظيم التقديرات على أساس المجموعة. 
رؤية فنية ۲-٠‏ 
مجموعات بيانات نصية كبيرة للتنقيب التنبؤي في النص وتحليل المشاعر 
yoga‏ الكونغرس حول :Floor-Debate‏ نشرها كل من Lees Pangs Thomas‏ 
(2006)؛ وتحتوي على خطابات سياسية تم تصنيفها لتوضيح ما إذا كان المتحدث يدعم 
أو يعارض التشريع الذي تمت مناقشته. 
:Economining‏ نشرتها مدرسة Stern‏ جامعة نيويوركء وتتكون من تعقيبات 
التجار في Amazon.com‏ 
مجموعات بيانات عرض الأفلام من :Cornell‏ وقد قدمها كل Pang‏ و(2008 (Lee‏ 
وتحتوي على ٠٠٠١‏ تصنيف إيجابي و١٠٠٠‏ تصنيف تلقائي سلبي مشتقة من عناوين مستوى 
الوثيقة و١۳۴٥‏ جملة / olas‏ إيجابية و١0۳۳‏ جملة / قصاصة سلبية. 
ستانفورد - مجموعة كبيرة لعرض الأفلام: وهي مجموعة من 70٠٠١‏ فيلم شديدة 
التناقض تتم مراجعتها للتدريب و١٠٠0‏ للاختبار. ويوجد بيانات إضافية للاستخدام 
بدون عنوان. كما يتم توفير تنسيقات للنصوص الخام وحقائب الكلمات ا معالجة 
IS‏ (انظر: .(http://ai.stanford.edu/~amaas/data/sentiment‏ 
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مجموعة :MPQA‏ تحتوي المجموعة ونظام استطلاع الرأي على ٠٠١‏ مقالًا إخباريًا 
مشروحة يدويًا من مجموعة متنوعة من مصادر الأخبار التي تحتوي على عناوين للأراء 
والتصريحات الخاصة (المعتقدات, العواطف المضاربات» إلخ). 

عروض مطاعم متعددة الجوانب: وقام بعرضها كل من Barzilay Snyder‏ (2007)؟ 
وتحتوي على ££M‏ مراجعة مع تقييم صريح من ١‏ إلى 0 لخمسة جوانب مختلفة: الطعام 
والجو والخدمة والقيمة بالإضافة إلى الخبرة العامة. 


تحديد الاتجاه الدلالي للجمل والعبارات: 

بمجرد تحديد الاتجاه الدلالي للكلمات الفردية» فمن المستحس ن في كثير من الأحيان تمديد 
ذلك إلى العبارة أو الجملة التي تظهر بها الكلمة. وأبسط طريقة لتحقيق هذا التجميع هي 
استخدام نوع من المتوسط لاستقطاب الكلمات في العبارات أو الجمل. وعلى الرغم من أنه Dab‏ 
ما يتم تطبيقه. إلا أن هذا التجميع يمكن أن يكون läge‏ مثل استخدام واحد أو أكثر من تقنيات 
تعلم الآلة لإنشاء علاقة تنبؤية بين الكلمات (وقيم تناقضها) والعبارات أو الجمل. 


تحديد الاتجاه الدلالي للوثائق: 

على الرغم من أن الغالبية العظمى من العمل في هذا المجال تتم في تحديد التوجه الدلالي للكلمات 
والعبارات / الجملء فإن بعض المهام مثل التلخيص واسترجاع المعلومات قد تتطلب وضع العلامات 
الدلالية للوثيقة بأكملها Ramage)‏ وآخرونء 5« (Y‏ ويتم Lal‏ تحقيق التجميع إلى مستوى الوثيقة 
بواسطة نوع من المتوسط على غرار الحالة في تجميع تناقض المشاعر من مستوى الكلمة إلى مستوى 
شبه الجملة أو الجملة. وقد لا يكون اتجاه المشاعر للوثيقة منطقيًا للوثائق الكبيرة Wilg dio‏ 
فغالبًا ما يتم استخدامه على الوثائق الصغيرة إلى متوسطة الحجم المنشورة على الإنترنت. 


أسئلة مراجعة على القسم 5-0: 

-١‏ ما هو تحليل المشاعر؟ وكيف يرتبط بالتنقيب في النص؟ 

lbg ما هي مجالات التطبيق الأكثر انتشارًا لتحليل المشاعر؟‎ -Y 

*- ما هي الفوائد المتوقعة والمستفادة من تحليل المشاعر في السياسة؟ 
-٤‏ ما هي الخطوات الرئيسة في تنفيذ مشاريع تحليل المشاعر؟ 

0- ما هما الطريقتان الشائعتان لتحديد التناقض؟ اشرح. 
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۷-٥‏ نظرة äle‏ على التنقيب في الويب: 

لقد غيرت شبكة الإنترنت خطوات إجراءات الأعمال إلى الأبد. ونظرًا لكون العام GYI‏ متصلا 
ببعضه البعض ومترابطًا بشكل كبير وأيضًا لاتساع مجال Las‏ تواجه الشركات اليوم بشكل متزايد 
فرصا أكبر (وهي القدرة على الوصول إلى Mas‏ وأسواق م يكن يُعتقد من قبل إمكانية الوصول 
إليها) وتحديات أكبر (أي السوق التنافسي المعوم والمتغير باستمرار). فالأفراد الذين يتمتعون برؤية 
وقدرات للتعامل مع مثل هذه البيئة المتقلبة يستفيدون منها بشكل كبيرء في حين يواجه غيرهم 
ممن يكرهون التغيير صعوبة في البقاء في السوق. وم يعد الدخول على شبكة الإنترنت الآن خيارًا 
ČLS‏ فقد أصبح أحد متطلبات العمل الآن. فالعملاء ينتظرون استلام المنتجات / الخدمات من 
الشركات عبر الإنترنت. ولا يتوقف الأمر على الشراء فحس ب. فهم LÉ‏ يشاركون مع أصدقائهم 
تجاربهم ومعاملاتهم التي تتم مع الشركات. 

لقد أدى النمو المتسارع في الإنترنت وتقنياته التمكينية إلى تسهيل عمليات إنشاء وجمع 
البيانات وتبادل البيانات / المعلومات / الآراء. كما أن التأخيرات في الخدمة وعمليات التصنيع 
والشحن والتسليم واستعلامات العملاء لم تعد اليوم حوادث خاصة ويتم استقبالها والتعامل 
معها باعتبارها sol‏ ضرورية. فالشركات الناجحة هي التي uus‏ تقنيات الإنترنت الحديثة فور 
ظهروه ا وتطوعها من أجل تحسين عملياتها التجارية بحيث lice‏ التواصل بشكل أفضل مع 
عملائها وفهم احتياجاتهم ورغباتهم وخدمتهم بشكل كامل وسريع. فلم يكن إطلاقًا التركيز على 
العملاء والحفاظ على مستوى رضاهم مفهومًا مهما للشركات كما هو في pas‏ الإنترنت ووسائل 
التواصل الاجتماعي التي نعيشها اليوم. 

تعتبر شبكة الإنترنت Älg‏ مستودع ضخم للبيانات والمعلومات حول كل شيء يمكن أن يتصوره 
أي أحد. على سبيل JULI‏ لا الحصرء الأعمال التجارية» الأبحاث والنظريات العلميةء مقالات في شتى 
المجالات» وبكميات وفيرة. Wisg‏ فربما تكون شبكة الويب هي أكبر مستودع للبيانات والنصوص 
في العام ويتزايد حجم المعلومات على الويب بسرعة» مما هكن أي باحث من العثور على الكثير 
من المعلومات اللثيرة لاهتمامه والوصول إلى صفحتها الرئيسية والصفحات الأخرى المرتبطة بهاء 
وكذلك إلى الأشخاص الذين لديهم روابط إلى تلك الصفحة. وبالإضافة إلى ذلك يقوم كل زائر لأي 
موقع ويب وكل بحث على أي محرك بحث وكل نقرة على أي رابط وكل معاملة على أي موقع 
للتجارة الإلكترونية بإنشاء بيانات إضافية. وعلى الرغم من أن البيانات النصية غير المهيكلة في شكل 
صفحات الويب والمكتوبة بلغة HTML‏ أو XML‏ هي المحتوى المهيمن على الويب» OB‏ البنية 
التحتية للويب تتضمن معلومات ارتباط تشعبي hyperlink information‏ (روابط إلى صفحات 
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ويب أخرى) ومعلومات الاستخدام (سجلات تفاعلات الزوار مع مواقع الويب) وكلها توفر بيانات 
غنية لاكتشاف المعرقة. كما هكن أن يساعدنا تحليل هذه المعلومات في تحسين استخدام مواقع 
الويب وكذلك مساعدتنا في تعزيز العلاقات والقيمة لزوار مواقعنا الخاصة. 
نخلص مما سبق إلى أن شبكة الإنترنت تتمتع بحجم Jila‏ ومعقد.ء مما يجعل التنقيب في 
الويب ليس daga‏ سهلةٌ بآي وسيلة من الوسائل. كما تشكل الويب Ue‏ تحديات كبيرة لاكتشاف 
فعال وكفء للمعرفة )2006 :(Han & Kamber,‏ 
- شبكة الويب كبيرة جدًا للتنقيب JEA‏ عن البيانات: إن شبكة الإنترنت كبيرة l>‏ ومتنامية بسرعة 
بحيث يصعب حتى قياس حجمها. ولذا؛ فليس من الممكن إنشاء مستودع بيانات لتكرار وتخزين 
ودمج جميع البيانات على الويب» مما يجعل جمع البيانات وتكاملها Kal‏ غاية في الصعوبة. 
- الويب معقدٌ للغاية: يعتبر تعقيد صفحة الويب أكبر بكثير منه لصفحة في مجموعة وثائق نصية 
تقليدية. وتفتقر صفحات الويب إلى بنية موحدة؛ فهي تحتوي على أنماط للتأليف ومحتوى 
كبر بكثير من أي مجموعة من الكتب أو المقالات أو غيرها من الوثائق النصية التقليدية. 
- الويب go>‏ جدًا: يعتبر الويب مصدرًا للمعلومات مفعمًا بالحيوية لأبعد الحدود. ولا ينمو 
لويب die ao‏ بل يتم تحديث محتواه باستمرار؛ إذ يتم تحديث المدونات والقصص الإخبارية 
ونتائج أسواق الأسهم وتقارير الطقس والنتائج الرياضية والأسعار وإعلانات الشركات وأنواع 
أخرى من المعلومات بشكل منتظم على الويب. 
- شبكة الويب ليست خاصة Jic‏ ما: تخدم الويب مجموعة كبيرة من المجتمعات كما تقوم 
بربط المليارات من محطات العمل. يتمتع مستخدمو الويب بخلفيات واهتمامات وأغراض 
استخدام مختلفة GLE‏ كما قد لا يكون لدى معظم المستخدمين معرفة جيدة بهيكل شبكة 
اللعلومات أو قد لا يكونون على دراية بالتكلفة الباهظة لعملية بحث معينة يقومون بها. 
- الويب يحتوي على كل شيء: يعتبر جزء صغير فقط من المعلومات الموجودة على الويب ذا صلة 
أو مفيد لشخص ما (أو aal‏ ما). JUS‏ إن XAI‏ من ابمعلومات على الويب لا فائدة منها ل XAA‏ 
من مستخدمي الإنترنت. وعلى الرغم من أن هذا قد لا يبدو واضحًاء إلا أن شخصًا ما قد يهتم 
بجزء صغير فقط من الويبء بينما تحتوي بقية الويب على معلومات يراها غير daga‏ بالنسبة 
له وهي قد تؤدي إلى النتائج المرجوة؛ إذ يعتبر العثور على جزء من الويب ذي صلة حقيقية 
بشخص ما والمهمة التي يقوم بتنفيذها مسألة شائكة فيما يخص البحث المتعلق بالويب. 
دفعت كل هذه التحديات العديد من الجهود البحثية لتعزيز فعالية وكفاءة اكتشاف 
واستخدام أصول البيانات على شبكة الإنترنت» حيث يقوم عدد من محركات البحث على الويب 
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القائمة على الفهرسة بالبحث باستمرار في الويب وتقوم بفهرسة صفحات الويب تحت كلمات 
رئيسية معينة. وباستخدام هذه المحركات قد يتمكن مستخدم متمرس من تحديد موقع الوثائق 
من خلال توفير مجموعة من الكلمات المفتاحية أو العبارات المقيدة بإحكام. ومع ذلك فإن أي 
محرك بحث بسيط يعتمد فقط على الكلمات المفتاحية قد يواجه بعض المشكلات, منها: 


-١‏ يمكن لأي موضوع معروض للبحث أن يحتوي بسهولة على مئات أو آلاف الوثائق. ويمكن 
أن يؤدي ذلك إلى عدد كبير من المدخلات ذات alo‏ هامشية بالموضوع والتي يتم إرجاعها 
بواسطة محرك البحث. 

-Y‏ قد لا تحتوي العديد من الوثائق ذات الصلة الكبيرة با موضوع محل البحث على كلمات رئيسة 
دقيقة لتحددها. 
كما سنقوم بتغطية أكثر تفصيلًا o‏ في هذا الفصلء مقارنة بالبحث على الويب القائم على 

الكلمات المفتاحية. يُعد التنقيب في الويب أحد الأساليب البارزة (والأكثر تحديًا) التي يمكن 

استخدامها لتعزيز قوة محركات البحث على الويب بشكل كبير؛ لأن التنقيب في الويب 435 

تحديد صفحات الويب» وتصنيف وثائق الويب. وحل العديد من الغموض والخواطر التي يتم 

جمعها في محركات البحث القائمة على الكلمات المفتاحية. 
يعرف التنقيب في الويب sl)‏ التنقيب في بيانات الويب) b‏ عملية اكتشاف العلاقات 

الجوهرية (أي المعلومات المثيرة للاهتمام والمفيدة) من بيانات «call‏ والتي يتم التعبير عنها في 

شكل معلومات نصية أو ارتباطية أو معلومات الاستخدام. وقد تم استخدام مصطلح التنقيب 
في الويب Web mining‏ لأول مرة بواسطة )1996( Etzioni‏ وتركز egal‏ العديد من ا مؤتمرات 
والمجلات والكتب على التنقيب في بيانات الويب. إنه مجال متطور باستمرار من التقنية والممارسات 
التجارية. ويعتبر التنقيب على الويب في الأماس نفس عملية التنقيب في البيانات التي تستخدم 
البيانات التي يتم توليدها عبر الويب. ويكون الهدف من ذلك هو تحويل مستودعات واسعة من 
المعاملات التجارية وتفاعلات العملاء وبيانات استخدام موقع الويب إلى معلومات قابلة للتطبيق 
(أي المعرفة) وذلك لتش جيع اتخاذ قرارات أفضل في جميع أنحاء المؤسسة. وبسبب زيادة انتشار 
مصطلح التحليلات» شرع الكثيرون في الوقت الحاضر في الرجوع إلى التنقيب على شبكة الإنترنت 
وتحليلات الويب. ومع eUS‏ لا يعتبر هذان المصطلحان à‏ واحدًا. وفي حين تعد تحليلات الويب 
في المقام الأول هي بيانات استخدام موقع الويب» فإن التنقيب على الويب daio‏ جميع البيانات 
التي يتم توليدها عبر الإنترنت بما في ذلك بيانات المعاملات الاجتماعية وبيانات الاستخدام. وحيث 
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تستهدف تحليلات الويب وصف ما حدث على موقع الويب (باستخدام منهجية تحليلية وصفية 
مبنية على مقاييس ومحددة مسبقًا). يهدف التنقيب في الويب إلى اكتشاف أنماط وعلاقات غير 
معروفة من قبل (باستخدام منهجية تحليلية جديدة للتنبؤ أو منهجية توجيهية). ومن منظور 
أكثر اتساعًاء يمكن اعتبار تحليلات الويب جزءًا من التنقيب في الويب. ويعرض الشكل )١١-0(‏ 
sas‏ بسيطً للتتنقيب على الويب» حيث يتم تقس يمه إلى ثلاثة مجالات رئيسة هي: التنقيب 
في محتوى الويب والتنقيب في بنية الويب والتنقيب باستخدام الويب. وفي هذا الشكل «ol‏ 
يتم تحديد مصادر البيانات المستخدمة في هذه المناطق الرئيسة الثلاثة. وعلى الرغم من أن هذه 
المجالات الثلاثة تظهر بشكل منفصلء كما سنرى في القسم التالي من هذا الفصلء إلا أنها غالبًا ما 
تُستخدم بشكل جماعي وتكاملي لمعالجة مشكلات وفرص الأنشطة التجارية. 





| | التتقيب فى | التنقيب‎ | 
QOEM, od j 


التنقيب فى الويب 


التنقيب فى استخدام الويب التنقيب فى هيكل الويب التنقيب فى محتوى الويب 
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شكل :1١-0‏ تصنيف مبسط للتنقيب في الويب 

وكما يوضح الشكل )1-0( يعتمد التنقيب على الويب بشكل كبير عاى التنقيب في البيانات 
واستخراج النصوص وأدواتها وتقنياتها d anal‏ والتي قمنا بتغطيتها بالتفصيل في وقت مبكر من 
هذا الفصل وفي الفصل السابق (الفصل (E‏ ويشير هذا الشكل أيضًا إلى أن هذه المناطق العامة 
الثلاثة تمتد إلى العديد من مناطق التطبيق المعروفة جيدًا. وقد تم شرح بعض هذه المجالات في 
الفصول السابقةء وسيتم تغطية بعض الجوانب الأخرى بالتفصيل في هذا الفصل. 
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التنقيب في محتوى الويب وهيكل الويب: 

يشير مصطلح التنقيب في محتوى الويب إلى استخراج المعلومات المفيدة من صفحات الويب؟ 
حيث يتم استخراج الوثائق بتنسيق هكن قراءته GI‏ حتى تتمكن التقنيات الآلية من استخلاص 
بعض المعلومات من صفحات الويب هذه. كما يتم استخدام برامج زواحف الويب Web crawlers‏ 
(ويُطلق عليها أيضًا العناكب (Spiders‏ لقراءة محتوى موقع الويب تلقائيًا. وقد تتضمن المعلومات 
التي تم تجميعها خصائص وثائقية مشابهة لما يتم استخدامه في التنقيب في النصء ولكنها قد 
تتضمن LÀ)‏ مفاهيم إضافيةء مثل التسلسل الهرمي للوثائق. ويمكن استخدام عملية الجمع الآلي 
(أو شبه (YII‏ لمحتوى الويب والتنقيب فيه للحصول على معلومات ذكاءية تنافسية (بما يعني 
جمع المعلومات المتعلقة بالمنافسين ومنتجاتهم وخدماتهم التي يقدمونها وعملائهم). كما OS‏ 
استخدامه Léi‏ لجمع المعلومات / الأخبار / الآراء وتلخيصها وتحليل المشاعر والجمع التلقائي 
للبيانات وتنظيمها من أجل النمذجة التنبؤية. وكمثال توضيحي لاستخدام التنقيب في محتوى 
الويب كأداة لجمع البيانات بطريقة T‏ دعنا نأخذ في الاعتبار ما يلي: منذ أكثر من ٠١‏ سنوات» 
e‏ كل من دكتور Deleng Sharda‏ بتطوير نماذج للتنبؤ بالنجاح JUL‏ لأفلام هوليوود قبل إصدارها 
المسرحي؛ حيث تأني البيانات التي يستخدمونها لتدريب النماذج من عدة مواقع على الويب» لكل 
منها بنية صفحة هرمية مختلفة. والجدير بالذكر أن عملية جمع مجموعة كبيرة من المتغيرات على 
آلاف الأفلام (من عدة سنوات سابقة) من مواقع الويب عملية تتطلب الكثير من الوقت وكذلك 
عرضة للخطأ. ولذلك؛ فهي تستخدم التنقيب في محتوى الويب والعناكب Spiders‏ باعتبارها تقنية 
تمكينية gazd‏ واختبار صحة وصلاحية وتخزين هذه القيم في قاعدة بيانات علائقية. (وفيما يخص 
اختبار الصحة والصلاحيةء فإذا كان عنصر البيانات المحدد Glia‏ على أكثر من موقع ويب واحد 
عندئذ يتم التحقق من صحة القيم ضد بعضها البعض ويتم التقاط وتسجيل الانحرافات)» وبذلك 
فهي تضمن جودة البيانات مع توفير وقت العملية الثمين (أيام أو أسابيع). 

وبالإضافة إلى احتوائها على «gos adl‏ تحتوي صفحات الويب أيضًا على روابط تشعبية 
تشير inio‏ واحدة إلى أخرى hyperlinks‏ إذ تحتوي الروابط التشعبية على قدر كبير من 
التعليقات التوضيحية البشرية المخفاة التي يمكن أن تساعد في الاستنتاج التلقائي لمفهوم المركزية 
أو السلطة. وعندما تشتمل صفحة ويب على رابط يشير إلى صفحة ويب أخرى» فيمكن اعتبار 
ذلك مثابة موافقة المطوّر على الصفحة الأخرى. وقد يشير التأييد الجماعي لصفحة معينة 
على الويب من قبل مطوّرين مختلفين إلى أهمية تلك الصفحةء وقد يؤدي ذلك JS a‏ طبيعي 
إلى اكتشاف عدة صفحات ويب موثوقة )2005 (Miller,‏ لذلك؛ فإن وجود كمية هائلة 
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من المعلومات المترابطة عبر الإنترنت يوفر مجموعة غنية من المعلومات حول مدى ملاءمة 

محتويات الويب وجودتها وهيكلهاء sss‏ بالتالي مصدرًا Cae‏ للتنقيب في الويب. 
كما يمكن استخدام التنقيب في محتوى الويب لتعزيز النتائج التي تنتجها محركات البحث. 

وفي الواقع» قد يكون البحث هو التطبيق الأكثر انتشارًا للتنقيب في محتوى الويب وتعديل بنية 

الويب. aleg‏ ما يقودنا البحث على الويب الذي يتم بغرض الحصول على معلومات حول 
موضوع معين (والذي يتم تقدهه كجملة أو مجموعة كلمات مفتاحية) إلى بضع صفحات ويب 
ذات صلة بالموضوع محل البحثء وتكون ذات جودة عالية وأيضًا إلى عدد SÍ‏ من صفحات 
الويب غير القابلة للاستخدام. ويؤدي استخدام الفهرس المتعلق بالموضوع محل البحث استنادًا 
إلى الكلمات اللفتاحية والصفحات الرسمية (أو بعض مقاييسها) إلى تحسين نتائج البحث وترتيب 
الصفحات ذات الصلة. وتنبع فكرة المسؤولية الفكرية (أو الصفحات الموثوقة) من استرجاع 
المعلومات سابقة النشر باستخدام اقتباسات من مقالات المجلات لتقييم تأثير الأوراق البحثية 

(Miller, 2005)‏ وبالرغم من أن هذا هو أصل SSA‏ إلا أن هناك اختلافات معنوية بين 

الاقتباسات في المقالات البحثية والروابط التشعبية hyperlinks‏ على صفحات الويب وهي: 

-١‏ لا يمثل كل رابط تشعبي مصادقة أو موافقة (فبعض هذه الروابط يتم إنشاؤه لأغراض التصفح 
وبعضها للإعلانات المدفوعة). وعلى الرغم من أن هذا صحيح» إذا كانت غالبية الارتباطات 
التشعبية من نوع المصادقةء فسيظل الرأي الجماعي سائدًا. 

-Y‏ بالنسبة للحالات التجارية والتنافسية» نادرًا ما ستشير إحدى الإدارات على صفحتها على الإنترنت 
إلى الصفحات المنافسة لها في نفس المجال. فعلى سبيل «JULI‏ قد لا تفضل Microsoft‏ 
تضمين روابط على صفحات الويب الخاصة بها تشير إلى المواقع الخاصة بشركة Apple‏ لأن 
هذا قد يعتبر بمثابة تصديق على سلطة منافسها. 

Yahoo قد لا تحتوي صفحة‎ Ñd نادرًا ما تكون الصفحات الموثوقة وصفية بشكل خاص.‎ -Y 
الرئيسية على وصف ذاتي صريح بأنه في الواقع محرك بحث.‎ 
وقد أفرز هيكل الروابط التشعبية على الويب تصنيقًا آخر مهما لصفحات الويب يسمى‎ 

ا محور hub‏ وهو واحد أو أكثر من صفحات الويب التي توفر مجموعة من الروابط المشيرة إلى 

صفحات موثوقة أخرى. وقد لا تكون المحاور بارزة Las‏ قد يشار إليها بروابط قليلة Jig‏ 

ومع ذلك فإنها توفر روابط تشير إلى مجموعة من الواقع البارزة حول الموضوع محل الاهتمام 

أو الدراسة. وقد يكون المحور عبارة عن قائمة بالروابط الموصى بها على الصفحات الشخصية: أو 
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قائمة بالمواقع المرجعية ا مقترحة على صفحة الويب الخاصة بدورة تدريبية da‏ أو قائمة موارد تم 
تجميعها بشكل احترافي حول موضوع محدد. كما تلعب ال محاور دورًا ضمنيًا في الحد من اتساع 
نطاق السلطات. وجوهربًاء توجد علاقة تكافلية وثيقة بين المحاور الجيدة والصفحات الموثوقة؛ 
فال محاور الجيدة تكون جيدة لأنها تشير إلى العديد من السلطات الجيدة والسلطة الجيدة تكون 
جيدة بسبب الإشارة إليها من قبل العديد من المحاور الجيدة. وهذه العلاقات بين المحاور 
والسلطات تجعل من الممكن تلقائيًا (LAG‏ محتوى عالي الجودة من الويب. 

إن أكثر الخوارزميات المعروفة والمشار إليها بشكل عام وا لمستخدمة في حساب المحاور 
والسلطات هي البحث عن الموضوع الذي يُحدثه الارتباط التشعبي (HITS)‏ والذي تم تطويره 
في الأصل من قبل )1999 .(Kleinberg,‏ ومنذ ذلك الحين تم تحسينه أكثر من مرة بواسطة 
العديد من الباحثين. إن HITS‏ عبارة عن خوارزمية تحليل رابط تقوم بتصنيف صفحات الويب 
باستخدام معلومات الرابط التشعبي الموجودة بداخلها. وفي سياق بحث الويب» تقوم خوارزمية 
5 بجمع مجموعة وثائق أساسية لاستعلام محدد di, us‏ ثم تقوم بشكل متكرر بحساب 
كل من المحور والسلطة لكل وثيقة. ولتجميع مجموعة الوثائق الأساسية» يتم استدعاء مجموعة 
الجذر التي تطابق الاستعلام من محرك بحث. ولكل وثيقة تم استرجاعهاء تتم إضافة مجموعة 
من الوثائق التي تشير إلى الوثيقة الأصلية ومجموعة أخرى من الوثائق التي يشار اليها بواسطة 
الوثيقة الأصلية إلى المجموعة على أنها منطقة الوثيقة الأصلية. وهكذا تستمر عملية متكررة 
لتحديد هوية الوثيقة وتحليل الرابط حتى تتقارب قيم كل من المحور والسلطةء ثم يتم استخدام 
هذه القيم لفهرسة مجموعة الوثائق التي تم إنشاؤها لاستعلام محدد وترتيبها حسب الأولوية. 

يعتبر التنقيب في هيكل الويب عملية استخراج معلومات مفيدة من الروابط AX‏ في 
وثائق الويب» ويتم استخدامه لتحديد الصفحات الموثوقة واطمحاورء والتي تعتبر حجر الزاوية 
في الخوارزميات المعاصرة للصفحات الأساسية: والتي تعتبر محورية لمحركات البحث الشهيرة 
.Yahoog Google J 5s‏ ومثلما تشير الروابط ال موضوعة لصفحة ويب إلى شعبية الموقع (أو 
موثوقيته)» قد تشير الروابط الموجودة في صفحة الويب (أو موقع الويب الكامل) إلى عمق 
التغطية لموضوع محدد. يعتبر تحليل الروابط مهما للغاية في فهم العلاقات المتبادلة بين أعداد 
كبيرة من صفحات الويب» مما يؤدي إلى فهم أفضل garab‏ ويب معين. 


أسئلة للمراجعة على قسم :V-0‏ 
1- ما هي بعض التحديات الرئيسة التي يفرضها الويب على اكتشاف المعرفة؟ 
-Y‏ ما هو التنقيب في الوبب؟ وكيف يختلف عن التنقيب المنتظم في البيانات أو التنقيب في النصوص؟ 
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التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


-A‏ ما هي المجالات الرئيسة الثلاثة للتنقيب في شبكة الإنترنت؟ 
-٩‏ ما هو التنقيب في محتوى الويب؟ وكيف هكن استخدامه jah‏ تنافسية؟ 
-٠١‏ ما هو التنقيب في هيكل (بنية) الويب؟ وكيف يختلف عن التنقيب في محتوى الويب؟ 


A-O‏ محركات البحث: 

في الوقت الحاليء لا يستطيع أحد إنكار أهمية محركات البحث على الإنترنت. وتجدر الإشارة 
إلى أنه كلما زاد حجم وتعقيد شبكة الويب العاطية أصبح العثور على ما تريد عملية معقدة 
وشاقة. ومن المعلوم أن محركات البحث تُستخدم لأسباب متنوعة. فيمكن استخدامها Sjel‏ 
على منتج أو خدمة ما قبل اتخاذ القرار بالشراء Le)‏ في ذلك اختيار البائع أو مقدم الخدمة 
والأسعار على المواقع / الباعة iie isl‏ والقضايا الشائعة التي يناقشها الناس حول هذا المنتج» 
ومدى رضا المشترين السابقينء وما هي المنتجات أو الخدمات الأخرى التي قد تكون أفضلء وما 
إلى ذلك). وللبحث عن الأماكن التي يجب زيارتهاء والأشخاص الواجب الالتقاء بهم والأشياء 
الواجب القيام بها. بمعنى آخرء أصبحت محركات البحث محور معظم المعاملات المستندة إلى 
الإنترنت وغيرها من الأنشطة. ويستند هذا الادعاء إلى النجاح المذهل والشعبية الجارفة لشركة 
(Google‏ وهي الشركة الأكثر انتشارًا في مجال محركات البحث. وما هو غامض إلى حد ما بالنسبة 
للكثيرين هو كيف يقوم محرك البحث بتنفيذ ما يقصده المستخدم. بعبارة أبسط يعتبر محرك 
البحث برنامجًا يقوم بالبحث عن الوثائق (مواقع الإنترنت أو الملفات)» استنادًا على الكلمات 
المفتاحية التي يقدمها المستخدمونء والتي تتعلق بموضوع بحثهم (سواء كانت كلمات فردية 
أو مصطلحات متعددة الكلمات أو جملة كاملة). إن محركات البحث اليوم هي منبر الإنترنت» 
وبإمكانها الاستجابة لملايين من الاستفسارات بمئات اللغات المختلفة كل يوم. 

من الناحية التقنيةء فإن ”محرك البحث“ هو المصطلح الشائع لأنظمة استرداد المعلومات. 
وعلى الرغم من أن محركات البحث على الويب هي الأكثر شيوعًاء Ulla‏ ما تُستخدم في سياقات 
أخرى غير الويب» مثل محركات بحث سطح المكتب ومحركات بحث الوثائق. وكما سترى في هذا 
القسم. فإن العديد من المفاهيم والتقنيات التي قمنا بتغطيتها في تحليلات النصوص والتنقيب 
في النص في وقت مبكر من هذا الفصل تنطبق هنا أيضًا. ويعتبر المدف العام لمحرك البحث 
هو إرجاع وثيقة / صفحة واحدة أو أكثر والتي تتطابق بشكل أفضل مع طلب بحث ا مستخدم 
وفي حالة وجود أكثر من وثيقة / صفحة واحدة فغالبًا ما يتم عرضهم في قائمة ,15 Just bs‏ 
محدد. وغالبًا ما يتم استخدام مقياسين لتقييم محركات البحث. وهما: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £N‏ 


الفصل الخامس 


-١‏ الفعالية (أو الجودة): وتعني العثور على الوثائق / الصفحات الصحيحة. 
-Y‏ الكفاءة (أو السرعة): وتعني إعادة الاستجابة بسرعة. 

ويعمل هذان المقياسان في اتجاهين متعاكسين, بمعنى أن تحسين أحدهما gb‏ على حساب 
الآخرء ويكون ذلك بالطبع وفقًا لتوقعات المستخدم. وأفضل محركات البحث هي تلك التي تنفوق 
في كل من المقياسين في نفس الوقت. ونظرًا لأن محركات البحث لا تبحث فقطء بل هي في الواقع 
تجد الوثائق / الصفحات وتعرضهاء فربما كان هناك اسم أكثر ملاءمة لها وهو محركات الإيجاد. 


تشريح محرك بحث: 

GY‏ دعونا نحلل محرك بحث وننظر في داخله. على أعلى مستوىء يتألف نظام محرك البحث 
من دورتين رئيستين: دورة تطوير ودورة استجابة (ويعرض الشكل )١7-0(‏ هيكل محرك بحث 
نموذجي على الإنترنت). ويمكننا تشبيه دورة التطوير بعملية الإنتاج (تصنيع وتخزين الوثائق / 
الصفحات) ودورة الاستجابة بعملية البيع بالتجزئة (تزويد العملاء / ا مستخدمين Ue‏ يريدون). 
وسيتم شرح هاتين الدورتين بمزيد من التفصيل في القسم التالي من هذا الفصل. 
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شكل :M-0‏ هيكل نموذجي dixb‏ بحث الإنترنت 














-١‏ دورة التطوير: 

يعتبر المكونان الرئيسان لدورة التطوير هما زاحف الويب Web crawler‏ ومفهرس الوثيقة 
document indexer‏ ويعد الغرض من هذه الدورة هو إنشاء قاعدة بيانات ضخمة من الوثائق 
/ الصفحات منظمة ومفهرسة Flou‏ على قيمة محتواها ومعلوماتها. ومما يظهر بوضوح شديد أن 
السبب في تطوير مثل هذا المستودع من الوثائق / الصفحات هو حجمه الكبير وتعقيده فالبحث 


ليك ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


في الويب للعثور على صفحات استجابة لتلبية احتياجات المستخدمين ليس las‏ (أو ممكنًا في إطار 
زمني معقول) ولذلك تقوم محركات البحث ”بتخزين الويب“ في قاعدة البيانات الخاصة dai‏ ومن 
ثم تستخدم النسخة المخبأة للويب للبحث عن وإيجاد كل ما يطلبه المستخدم. وبمجرد إنشائهاء 
تسمح قاعدة البيانات هذه بلحركات البحث بالرد بسرعة وبدقة على استعلامات المستخدمين. 


- زاحف الويب :Web crawler‏ (ويس مى أيضًا العنكبوت أو عنكبوت الويب) وهو جزء من برنامج 
يقوم بالتصفح بشكل منهجي (أي يزحف عبر الإنترنت) بغرض العثور على صفحات الويب وجلبها. 
ds‏ كثير من الأحيان تقوم برامج زحف الويب بنسخ كل الصفحات التي تتم زيارتها وذلك يلعالجتها 
لاحقًا بواسطة وظائف أخرى dod‏ البحث. يبدأ زاحف الويب بإعداد قائمة من عناوين URL‏ 
مراد زیارتهاء ويتم سردها في «Joa‏ وغالبًا ما يطلق عليها البذور. وقد تأت عناوين URL‏ هذه 
من تقدهات مشرف المواقع أو - في أغلب الأحيان - تأي من الروابط التشعبية الداخلية للوثائق / 
للصفحات التي تم الزحف إليها سابقًا. وجرد أن يزور الزاحف عناوين URL‏ هذه فإنه يحدد 
جميع الروابط التشعبية الموجودة في الصفحة ويضيفها إلى قائمة عناوين URL‏ المراد زيارتها. وتتم 
زيارة عناوين URL‏ المجدولة بشكل متكرر وفقًا لمجموعة من السياسات التي يحددها محرك 
البحث المحدد. ونظرًا لوجود عدد كبير جدًا من صفحات الويب» فيمكن للزاحف تنزيل عدد 
محدود فقط منها في وقت معين فقط؛ ولذلك فهي تحتاج إلى تحديد أولويات التنزيلات الخاصة بها. 
- مفهرس الوثيقة document indexer‏ عندما يتم العثور على الوثائق وجلبها من خلال 
الزاحف» يتم تخزينها في منطقة مؤقتة لمفهرس الوثيقة وذلك لاستخراجها ومعالجتها. ويكون 
مفهرس الوثيقة oS aa‏ عن معالجة الوثائق (صفحات الويب أو ملفات الوثائق) ووضعها 
في قاعدة بيانات خاصة las‏ ولتحويل الوثائق / الصفحات إلى التنسيق المرغوب فيه والقابل 
للبحث عنه بسهولةء يقوم مفهرس الوثائق بتنفيذ المهام التالية: 
- الخطوة -١‏ المعالجة المسبقة للوثائق: نظرًا لاحتمالية ظهور الوثائق المتحصل عليها عن طريق 
الزاحف في تنسيقات مختلفة. ولسهولة معالجتها ASÍ‏ فسيتم في هذه الخطوة تحويلها كلها 
إلى أحد أنواع التمثيل القياسي. فمثلًا يتم فصل المحتويات المختلفة عن بعضها البعض 
ومن ثم تنسيقها (إذا لزم الأمر)» وتخزينها في مكان ما لزيد من اللعالجة. وتتضمن هذه 
المحتويات No‏ (النصوصء الروابط التشعبيةء الصور, إلخ). 
- الخطوة -Y‏ تحليل الوثائق: وهذه الخطوة هي Lála‏ تطبيق أدوات وتقنيات التنقيب في 
النص (أي اللغويات الحاسوبيةء ومعالجة اللغة الطبيعية (NLP‏ إلى مجموعة من الوثائق 
/ الصفحات. وفي هذه الخطوة يتم Fol‏ تحليل الوثائق القياسية إلى مكونات لتحديد 
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الفصل الخامس 


الكلمات / المصطلحات الجديرة بالفهرسة» ثم بعد ذلك - وباستخدام مجموعة من القوانين 
- تتم فهرسة الكلمات / المصطلحات. وبش كل أكثر تحديدًا - وباستخدام قواعد التحويل - 
يتم استخراج الكلمات / المصطلحات / الكيانات من الجمل الموجودة في هذه الوثائق» ثم 
باستخدام معاجم خاصةء يتم تصحيح الأخطاء الإملائية والأخطاء الأخرى في هذه الكلمات 
/ المصطلحات» مع ملاحظة عدم كون كل المصطلحات من أدوات التمييز. كما يتم استبعاد 
الكلمات / المصطلحات غير التمييزية (والمعروفة Lá‏ باسم كلمات التوقف) من القائمة 
الجديرة بالفهرسة. ونظرًا لاحتمال ظهور نفس الكلمة / المصطلح بصيغ متعددة ومختلفة, 
فيتم اتخاذ بعض الإجراءات التي تعمل على تقليل عدد الكلمات / ا لمصطلحات ووضعها في 
صورها الأصلية. yag‏ أخرى» يتم استخدام المعاجم وموارد أخرى خاصة بلغة معينة Jia)‏ 
(WordNet‏ كما يتم تحديد المرادفات والمجانسات ABAU‏ لمعالجة مجموعة الكلمات / 
المصطلحات قبل الانتقال إلى مرحلة الفهرسة. 

- الخطوة -Y‏ إنشاء مصفوفة ”المصطلح بحسب الوثيقة“ :Term-by-document‏ 

في هذه ghidt‏ يتم تحديد العلاقات بين الكلمات / المصطلحات والوثائق / الصفحات. 
ويمكن أن يكون الوزن بسيطًا كتخصيص (Y)‏ للحضور أو (0) للغياب في الوثيقة / الصفحة. 
foleg‏ ما يتم استخدام مخططات الوزن الأكثر تطورًا. وعلى سبيل «JE‏ في تعارض ثنائي» قد 
يتم تخصيص التكرار كوزن (أي عدد مرات وجود نفس الكلمة / المصطلح في الوثيقة). وكما 
رأينا سابقًا في هذا الفصلء فقد أشارت الأبحاث والممارسات المتعلقة بالتنقيب عن النصوص 
بوضوح أن أفضل ترجيح قد db‏ من استخدام مصطلح التكرار مقسومًا على تكرار العكسي 
الوثيقة (TF / IDF)‏ تقيس هذه الخوارزمية تكرار حدوث كل كلمة / مصطلح في وثيقة ما 
ثم تقارن ذلك التكرار في مقابل تكرار حدوثه في مجموعة الوثائق. وكما نعلم جميعًاء لا تعتبر 
كل الكلمات / المصطلحات ذات التكرار العالي عوامل تمييز جيدة للوثيقةء وأيضًا فإن أحد 
العناصر الجيدة لتمييز الوثيقة في مجال ما قد لا يكون جيدًا في مجال آخر. وبمجرد تحديد 
مخطط الوزن» يتم حساب الأوزان ويتم إنشاء ملف فهرس «المصطلح بحسب الوثيقة». 

-Y‏ دورة الاستجابة: 
يعتبر المكونان الرئيسان لدورة الإستجابة هما محلل الاستعلام query analyzer‏ ومُطابق / 

-document matcher/ranker مصنف الوثيقة‎ 

- محلل الاستعلام :query analyzer‏ يكون محلل الاس تعلام مسؤولًا عن تلقي طلب البحث 

من المستخدم (عبر واجهة ext‏ الويب محرك البحث) وتحويله إلى هيكل بيانات قياسي 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 
بحيث oce‏ استجوابه / مطابقته بسهولة في مقابل الإدخالات في قاعدة بيانات الوثيقة. إن 
كيفية قيام محلل الاستعلام Ue‏ يفترض alas‏ تشابه Gle‏ ما يقوم به مفهرس الوثيقة LS)‏ تم 
توضيحه منذ قليل)؛ حيث يقوم محلل الاستعلام بتوزيع جملة البحث إلى كلمات / مصطلحات 
فردية باستخدام سلسلة من المهام التي تشمل التحويلء وإزالة كلمات التوقف» وتطبيق بعض 
الإجراءات» وتوضيح الكلمة / المصطلح (أي تحديد الأخطاء الإملائية» والمترادفات والمجانسات 
اللفظية). إن التشابه الوثيق بين محلل الاستعلام ومفهرس الوثيقة ليس من قبيل الصدفة. في 
الواقع» إن هذا التشابه منطقي تمامًا نظرًا ON‏ كليهما يعمل خارج قاعدة بيانات الوثائق؛ فأحدها 
يضع الوثائق / الصفحات باس تخدام هيكل فهرس محدد. والآخر يقوم بتحويل سلسلة استعلام 
إلى نفس الهيكل بحيث يمكن استخدامها لتحديد موقع الوثائق / الصفحات ذات الصلة بسرعة. 
- مُطابق / مصنف الوثيقة :document matcher/ranker‏ وهنا تتم مطابقة بيانات الاستعلام 
المهيكلة مع قاعدة بيانات الوثيقة للعثور على الوثائق / الصفحات الأكثر ملاءمة وترتيبها أيضًا 
حسب ترتيب وثاقة الصلة بالموضوع / الأهمية. ورا يكون إتقان هذه الخطوة هو المكون 
الأكثر أهمية عند مقارنة محركات البحث المختلفة مع بعضها البعض. وهتلك كل محرك بحث 
خوارزمية خاصة به (وغالبًا تكون ملكية مرخصة) يستخدمها لتنفيذ هذه الخطوة المهمة. 
استخدمت محركات البحث في بداية ظهورها تطابقًا بسيطًا للكلمة المفتاحية مع قاعدة 
بيانات الوثائق وأعادت قائمة الوثائق / الصفحات المرتبة» حيث كان يعتبر تحديد الطلب هو 
إحدى الوظائف التي استخدمت عدد الكلمات / المصطلحات المتطابقة بين الاستعلام والوثيقة إلى 
جانب أوزان تلك الكلمات / المصطلحات. لم تكن جودة وفائدة نتائج البحث كلها جيدة. بعد 
«ell‏ وتحديدًا في عام VIIV‏ توصل منشئو Google‏ إلى خوارزمية جديدة تسمى -Page Rank‏ 
وكما يشير الاسم يعتبر Page Rank‏ طريقة حسابية لترتيب الوثائق / الصفحات بناءً على مدى 
ملاءمتها وقيمتها / أهميتها. وعلى الرغم من كون Page Rank‏ طريقة مبتكرة لتصنيف الوثائق 
/ الصفحات» إلا أنه يعد زيادةً في عملية استرجاع الوثائق ذات الصلة من قاعدة البيانات وترتيبها 
La‏ على أوزان الكلمات / المصطلحات. تقوم Google‏ بكل ذلك بشكل جماعي بغرض إعداد 
أفضل ib‏ وثائق / صفحات من حيث الصلة بطلب البحث المعطى. وجرد إنشاء Ag‏ مرتبة 
من الوثائق / الصفحات» يتم إعادتها Epa‏ أخرى إلى المستخدم بتنسيق سهل الاستيعاب. في هذه 
امرحلةء قد يختار ا لمستخدم أي وثيقة من الوثائق الموجودة في القائمة والنقر عليهاء وقد لا تكون 
هذه الوثيقة هي الأولى في أعلى القائمة. وإذا حدث هذا وتم اختيار وثيقة / صفحة غير الموجود 
في أعلى AW‏ فهل هكننا أن نفترض أن محرك البحث م يقم بترتيبهم ترتيبًا جيدًا؟ قد تكون 
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الإجابة نعم حيث تقوم محركات البحث الرائدة مثل Google‏ هراقبة أداء نتائج البحث الخاصة 
بها من خلال التقاط وتسجيل وتحليل إجراءات وتجارب ما بعد تسليم المستخدمين. وغالبًا 
ما تؤدي هذه التحليلات إلى المزيد والمزيد من القواعد بهدف زيادة تحسين ترتيب الوثائق / 
الصفحات بحيث تكون الروابط في الأعلى هي الأكثر تفضيلًا للمستخدمين النهائيين. 


تحسين محرك البحث: 

إن تحسين محرك البحث (580) هي ممارسة يقصد منها التأثير على رؤية موقع التجارة 
الإلكترونية أو موقع الويب في نتائج البحث الطبيعية (غير المدفوعة أو الأساسية) بلحرك البحث. 
وبشكل cele‏ كلما ارتفعت الرتبة في صفحة نتائج البحثء وكلما تكرر ظهور الموقع في قائمة 
نتائج البحثء ازداد عدد الزوار الذين سيحصلون عليه من مستخدمي محرك البحث. وكإحدى 
إستراتيجيات التسويق عبر الإنترنت» تضع SEO‏ في اعتبارها كيفية عمل محركات eani‏ وما 
يبحث عنه الأشخاص.ء والمصطلحات الحقيقية للبحث أو الكلمات المفتاحية التي تتم كتابتها في 
محركات البحثء ومحركات البحث التي يفضلها الجمهور ا مستهدف. وقد ينطوي تحسين موقع 
الويب على تعديل محتواه HTMLs‏ والتشفير المرتبط به لزيادة مدى ملاءمته لكلمات رئيسة 
محددة ولإزالة الحواجز أمام أنشطة الفهرسة لمحركات البحث. كما يعد الترويج لموقع ما بغرض 
زيادة عدد الروابط الخلفية أو الداخليةء أحد الأساليب الأخرى لتحسين محركات البحث. 

في السابق» ولكي تتم الفهرسة» كان على كل مشرفي اللواقع إرسال عنوان dado‏ أو عنوان 
URL‏ إلى مختلف ال محركات» والتي ستقوم بعد ذلك بإرسال "as Sae"‏ لكي يقوم ب ”الزحف“ 
تجاه تلك daia‏ ومن ثم يستخرج منها الروابط إلى laio‏ ثم يقوم بإرجاع المعلومات التي 
تم العثور عليها على الصفحة إلى الخادم لتتم الفهرسة. وكما تم التوضيح من «uS‏ تتضمن هذه 
العملية eL‏ عنكبوت محرك بحث بتنزيل صفحة وتخزينها على الخادم الخاص بمحرك البحثء 
حيث يقوم برنامج آخر - يعرف باسم المفهرس - باستخلاص معلومات متنوعة عن تلك الصفحة, 
مثل الكلمات التي تحتويها ومواقع تلك الكلمات بالتحديدء بالإضافة إلى أي وزن لكلمات محددة, 
وكل الروابط التي تحتوي عليها daia‏ والتي تتم جدولتها بعد ذلك بغرض القيام بالزحف في 
وقت لاحق. أما الآن» فلم تعد محركات البحث تعتمد على تقديم مشرفي المواقع عناوين URL‏ 
ule)‏ الرغم من قدرتهم على فعل ذلك حتى الآن)؛ ولكنهم يمارسون الزحف الحثيث والمستمر 
على الويب لإيجاد وجلب وفهرسة كل شيء يتعلق بالبحث. 

إن إجراء الفهرسة بواسطة محركات بحث Yahoos Bingg Google Jio‏ ليس Le uo‏ 
فيه الكفاية للأنشطة التجارية. حيث إن اكتساب ترتيب على محركات البحث الأكثر استخدامًا 
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والحصول على مرتبة أعلى من منافسيك هو ما يصنع الفرق (انظر الفكرة التطبيقية (F-0)‏ 
للحصول على قائمة محركات البحث الأكثر استخدامًا). ويمكن رفع ترتيب iaio‏ ويب داخل 
نتائج البحث باستخدام مجموعة متنوعة من الأساليب. كما أن الارتباط المتبادل بين صفحات 
نفس موقع الويب يوفر مزيدًا من الروابط إلى الصفحات الأكثر أهمية مما يزيد من فرص رؤيتها 
ضمن نتائج البحث. وستؤدي كتابة المحتوى الذي يتضمن عبارات الكلمات المفتاحية التي يتم 
البحث عنها بشكل متكرر - بحيث تكون ذات صلة بمجموعة كبيرة من استعلامات البحث - إلى 
زيادة sas‏ الزيارات. كما أن تحديث المحتوى بغرض الحفاظ على الزحف إلى محركات البحث 
بشكل متكرر يضفي على الموقع زيادة في الوزن. وكذلك تؤدي إضافة كلمات رئيسة ذات صلة إلى 
البيانات الوصفية لصفحة الويب - بما في ذلك علامة العنوان والوصف الدقيق - إلى تحسين مدى 
ملاءمة قوائم البحث الخاصة بالموقع: وبالتالي زيادة عدد الزيارات. ويمكن أن تساعد تسوية 
عناوين URL‏ لصفحات الويب - بحيث يمكن الوصول إليها عبر عناوين URL‏ متعددة واستخدام 
عناصر ربط العناوين الأساسية والاتجاهات - في التأكد من أن جميع الروابط المؤدية إلى إصدارات 
مختلفة من عنوان URL‏ يتم احتسابها في جميع أنحاء نقاط انتشار رابط الصفحة. 
رؤية فنية 0-: 
أعلى ٠١‏ محرك بحث الأكثر انتشارًا (أغسطس (PAT‏ 
نعرض فی ما يلي أعلى YO‏ محرگا من محركات البحث الأكثر انتشارًا ومصدرها 

«zmba.com/articles/search-ngines ذكاء الأعمال‎ ebizMBA Rank) من:‎ 

وهو متوسط يتم تحديثه باستمرار لكل من موقع Alexa Global Traffic Rank‏ و 

-Quantcasts Compete من كل من‎ U.S.Traffic Rank 
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طرق تحسين محركات البحث: 

بشكا عام يمكن تصنيف تقنيات تحسين محركات البحث إلى فئتين رئيستين: 
-١‏ التقنيات التي توصي بها محركات البحث كجزء من التصميم الجيد للموقع. 
-Y‏ التقنيات التي لا تقبلها محركات البحث. 

تحاول محركات البحث تقليل تأثير g gl‏ الثاني - والذي غالبًا ما 52.145( spamdexing‏ 
(ويُعرف أيضًا باسم البحث غير المرغوب فيه search spam‏ أو محرك بحث غير مرغوب فيه 
«search engine spam‏ أو تسمم محرك البحث (search engine poisoning‏ وقد تم تصنيف 
هذه الأساليب والممارسين لها إلى قسمين: أدوات SEO‏ ذات قبعة بيضاء وأدوات SEO‏ ذات قبعة 
سوداء )2005 (Goodman,‏ حيث تميل القبعات البيضاء إلى إفراز نتائج تدوم لفترة طويلة في 
حين تتوقع القبعات السوداء حظر مواقعها في نهاية المطاف ls]‏ بشكل مؤقت أو دائم بمجرد أن 
تكتشف محركات البحث ما تفعله. 


تعتبر تقنية تحسين محركات البحث (SEO)‏ قبعة بيضاء إذا كانت متوافقة مع إرشادات محرك 
البحث ولا تحتوي على أي glas‏ ونظرًا لأن إرشادات محرك البحث لا تكتب كسلسلة من القواعد 
أو الوصاياء فإن هذا تمييز مهم يجب ملاحظته. ولا يقتصر دور SEO‏ ذات القبعة البيضاء على اتباع 


الإرشادات فحسبء بل هتد إلى ضمان أن المحتوى الذي يفهرسه محرك البحث ثم يصنف لاحقًا هو 
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نفس المحتوى الذي سيراه أي مستخدم. وعادةً ما يتم تلخيص نصيحة القبعة البيضاء على أنها إنشاء 
محتوى للمستخدمينء وليس لمحركات البحث. ثم تسهيل الوصول لهذا المحتوى بواسطة العناكب» 
بدلا من محاولة خداع الخوارزمية من الغرض المراد منها. كما يعتبر SEO‏ ذو القبعة البيضاء أحد 
الأوجه العديدة المشابهة لتطوير الويب الذي يدعم إمكانية الوصولء على الرغم من تطابقهما. 

يحاول SEO‏ ذو القبعة السوداء تحسين الترتيب بطرق غير مقبولة من cale‏ محركات 
البحثء أو بأساليب تنطوي على شيء من الخداع. تستخدم تقنية القبعة السوداء النص ال مخفيء 
إما بتلوينه بنفس لون الخلفية أو بعلامة "div"‏ غير مرئية أو بوضعه خارج الشاشة. وتعطي 
طريقة أخرى صفحة مختلفة اعتمادًا على كون الصفحة مطلوبة سواء بواسطة زائر بشري أو 
محرك بحثء وهي تقنية تُعرف باسم إخفاء الهوية أو التغطية „cloaking‏ كما قد تعمد محركات 
البحث إلى معاقبة المواقع التي تكتشفها باستخدام أساليب القبعة السوداء» إما عن طريق تقليل 
ترتيبها أو إزالة قوائمها من قواعد بياناتها -Gle‏ ويمكن توقيع هذه العقوبات إما GAD‏ من خلال 
خوارزميات محركات البحث أو من خلال مراجعة يدوية للموقع. ومن الأمثلة على ذلك ما 
قامت به شركة Google‏ فبراير ٠٠١“‏ عندما قامت Jb‏ كل من Ricohs UÍ BMW‏ أمانيا 
لقيامهما ممارسات غير معتمدة )2006 (Cutts,‏ ومع US‏ سارعت الشركتان بتقديم الاعتذار 
وتصحيح ممارساتهماء ومن ثم تمت إعادتهما إلى قانئمة -Google‏ 

بالنسبة لبعض الأنشطة التجارية. قد يحقق SEO‏ عائدًا Du‏ على الاستثمار. ومع ذلكء يجب 
الأخذ في الاعتبار أن محركات البحث غير مدفوعة لحركة البحث Ls‏ وأن خوارزمياتها تتغير 
باستمرارء ولا توجد ضمانات لاستمرار الإحالات. وبسبب هذه الحالة من عدم اليقين أو عدم 
الاستقرارء فقد تتكبد الأعمال التجارية التي تعتمد بشكل كبير على زيارات محركات البحث خسائر 
كبيرة إذا قرر محرك البحث تغيير خوارزمياته والتوقف عن استقبال الزوار. يقول Eric Schmidt‏ 
الرئيس التنفيذي لشركة :Google‏ ”أجرت à Google‏ عام ٠‏ أكثر من 00١‏ تغيير خوارزمية 
أي ما يقرب من ١,0‏ تغيير في اليوم الواحد“. ونظرًا لصعوبة مواكبة قواعد محرك البحث المتغيرة 
باستمرار» فإن الشركات التي تعتمد على حركة البحث تمارس واحدًا أو أكثر من الإجراءات التالية: 
-١‏ استئجار شركة متخصصة في تحسين محركات البحث (والتي يتوافر عدد كبير منها في هذه الأيام) 

وذلك لتحسين جاذبية الموقع الخاص بها باستمرار لتغيير ممارسات محركات البحث. 
-Y‏ تشجيع شركات محركات البحث لإدارج أسمائهم في أقسام الجهات الراعية المدفوعة. 
*- النظر في التحرر من الاعتماد على حركة محرك البحث. 
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إن أهم ما هيز أي مواقع تجارة إلكترونية - سواء كانت معتمدة على محركات البحث 
(بعضوية أو بدون) أو قادمة من مواقع وأماكن أخرى - هو زيادة احتمالية معاملات العملاء إلى 
أقصى حد. ولا يعتبر وجود عدد كبير من الزائرين دون مبيعات هو ما تم تصميمه بلوقع التجارة 
الإلكترونية النموذجي. وتتعلق الحالة العملية (V-0)‏ بمركز تسوق كبير يعتمد على الإنترنت حيث 
يتم استخدام تحليل مفصل لسلوك العميل (باستخدام نقرات ومصادر البيانات الأخرى) لتحسين 


معدل التحويل بشكل ملحوظ. 


حالة عملية V-0‏ 
edd‏ لماذا يؤدي التنازل عن عربات التسوق إلى زيادة مبيعات بمقدار ٠١‏ مليون دولار 

قام مركز Lotte.com‏ وهو مركز تسوق الإنترنت الرائد في كوريا والذي يضم 
۴ مليون عميلء بتطوير نظام متكامل لتحليل حركة زيارات الويب باستخدام SAS‏ 
لتحليلات تجربة العملاء. ونتيجة UU‏ تمكن Lotte.com‏ من تحسين تجربة الإنترنت 
لعملائهاء فضلًا عن تحقيق عوائد أفضل من حملاتها التسويقية. والآنء هكن للمديرين 
التنفيذيين ل Lotte.com‏ تأكيد النتائج في أي مكان وف أي «28s‏ بالإضافة إلى إجراء 
تغييرات فورية. 

ومع ما يقرب من silo‏ زائر ملوقع الويب كل «es»‏ كان Lotte.com‏ بحاجة إلى معرفة 
عدد الزوار الذين يقومون بالشراء وما هي القنوات التي تجلب الزيارات الأكثر قيمة. بعد 
استعراض العديد من Jald!‏ والأساليب المتنوعة. قدم Gli; Lotte.com‏ متكاملًا خاضًا 
به لتحليل حركة زيارات الويب باستخدام حل SAS‏ لتحليل تجارب العملاء وهذا هو dal‏ 
نظام للتحليل (sl‏ على الإنترنت يطبق في كوريا. 

وباستخدام هذا النظام يمكن مركز Lotte.com‏ قياس وتحليل كل من أعداد زوار 
موقع الويب .35( والحالة الراهنة لعرض الصفحة أمام slaj‏ الموقع ومبرمي الصفقات» 
وشعبية كل فئة من فئات المنتجات وكذلك شعبية المنتجات نفسهاء والنقرات على 
التفضيلات الخاصة بكل daio‏ وفعالية الحملات. وغير ذلك الكثير. أي أن هذه 
المعلومات 55 Lotte.com‏ من فهم العملاء وسلوكهم على الإنترنت بشكل asl‏ 
وإجراء التسويق المستهدف المتطور والفعال من حيث التكلفة. 

وتعليقًا على هذا elbil‏ قال Jung Hyo-hoon‏ مساعد المدير العام بفريق 
تخطيط التسويق لوقع fua” :Lotte.com‏ لإدخال نظام تحليل SAS‏ تم اكتشاف 
العديد من”الحقائق الجديدة“حول سلوك العملاء وبعضها كانت «حقائق غير مريحة» 
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وأضاف: ”في الواقع كان لبعض أنشطة تخطيط الموقع التي تم الاضطلاع بها مع توقع 
نتائج معينة رد فعل ضعيف من جانب العملاء واحتاج مخطط و الموقع 655 طويلا 
للتعرف على هذه النتائج“. 

فوائد: 

وقد أدى تقديم حلول SAS‏ لتحليل تجربة العملاء إلى تحويل موقع الويب Lotte.‏ 
com‏ بشكل كامل. ونتيجة لذلكء Lotte.com (3 S.‏ من تحسين تجربة الإنترنت 
لعملائه بالإضافة إلى تحقيق عوائد أفضل من حملاته التسويقية. ومنذ تطبيق SAS‏ 
لتحليلات تجربة العملاء جنى Lotte.com‏ العديد من الفوائدء منها: 

قفزة في ولاء العملاء: 

يمكن جمع كمية كبيرة من معلومات النشاط المتطورة في إطار بيئة الزائرء ما في 
ذلك جودة الزيارات. ai" Jung Js‏ من خلال تحليل الزيارات الصالحة الفعلية 
والبحث في صفحة أو صفحتين فقطء Sg‏ تنظيم حملات لرفع مستوى الولاء ومن 
ثم تحديد نطاق معين من التأثير. وبالإضافة «tJ‏ من الممكن تصنيف وتأكيد معدل 
الطلب لكل قناة ومعرفة أي القنوات تحتوي على أكبر عدد من الزائرين". 

تحليل كفاءة التسويق الأمثل: 

لا يقتصر النظام على مجرد تحليل أرقام الزائرين فقط. بل يستطيع تحليل معدل 
التحويل (عربة التسوقه الشراء الفوري, قائمة «Li JI‏ إتمام الصفقة) مقارنة بالزوار 
الفعليين لكل نوع من أنواع الحملات (الانتساب أو البريد الإلكترونيء اللافتات» الكلمات 
المفتاحية: وغيرها)» لذلك هكنه أيضًا إجراء ddos‏ مفصل لفعالية القناة. بالإضافة 
إلى ذلك يمكنه التأكد من كلمات البحث الأكثر استخدامًا من جانب الزوار لكل نوع 
حملة وا موقع والمنتجات المشتراة. كما يمكنه عن طريق "the page overlay" o‏ 
قياس عدد النقرات وعدد الزوار لكل عنصر في أي صفحة لقياس قيمة كل موقع في 
الصفحة. تمكن هذه الإمكانية Lotte.com‏ من الاستبدال أو التجديد الفوري للعناصر 
ذات الزيارات القليلة. 

La;‏ العملاء المحسّن وتجاربهم يؤديان إلى ارتفاع المبيعات: 

قام Lotte.com‏ بإنشاء قاعدة بيانات تحليل س لوك العملاء التي تقيس كل زائر» 
والصفحات التي تتم زيارتهاء وكيف يتنقل الزوار في الموقع» والأنشطة التي يتم تنفيذها 
لتمكين التحليل المتنوع وتحسين كفاءة الموقع. بالإضافة إلى ذلكء تحتفظ قاعدة 
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البيانات بمعلومات عن التوزيعات السكانية للعملاء وحجم عربة التسوق ومعدل 
التحويل وعدد OLII‏ وعدد المحاولات. 

وبتحليل مراحل عملية الطلب وتحديد المرحلة التي تعيق معظم العملاء ومن ثم 
تثبيت هذه المراحلء يمكن زيادة معدلات التحويل. في io adl‏ تم التحليل فقط على 
الطلبات الموضوعة. ومن خلال تحليل نمط حركة الزوار قبل الطلبء وعند النقطة 
التي يحدث فيها الانفصالء يمكن توقع dsl Lo‏ العملاء GS‏ يمكن القيام بأنشطة تسويق 
متطورة. ومن خلال تحليل نمط الزائرين» يمكن أن تتأثر عمليات الشراء بشكل أكثر 
فاعلية وبالتالي ينعكس طلب العملاء بشكل فوري لضمان الحصول على استجابات 
أسرع. وقد حدث تحسن في رضا العملاء لوجود فكرة أفضل لدى Lotte.com‏ عن 
سلوكيات واحتياجات واهتمامات كل عميل. 

وفي تقييمه phl‏ علق Jung‏ 368 ”هكن تحديد تحسينات في خدمة العملاء 
ومواضيع التسويق المستهدفة من خلال معرفة كيفية تحرك كل مجموعة من العملاء 
على أساس البيانات»مما ساعد على نجاح عدد من الحملات“. 

ومع ذلك. فإن الفائدة الأكثر أهمية من هذا النظام هي اكتساب نظرة ثاقبة عن 
العملاء الأفراد ومجموعات العملاء المختلفة. ومن خلال فهم التوقيت الذي يبرم فيه 
العملاء صفقات الشراء وأسلوبهم في التنتقل عبر صفحة الويبء يمكن الآن تحقيق 
التسويق المستهدف للقنوات وتحسين تجربة العملاء. 

بالإضافة إلى ذلك فقد أدى تنفيذ SAS‏ لتحليلات تجربة العملاء من قبل أكبر موزع 
عبر البحار مركز Lotte.com‏ إلى زيادة في مبيعات السنة الأولى بقيمة ۸ ملايين يورو 
(أي ما يعادل ٠١‏ ملايين دولار أمريي) من خلال تحديد أسباب هجر عربة التسوق. 

أسئلة للمناقشة: 

-١‏ كيف استخدم Lotte.com‏ التحليلات لتحسين المبيعات؟ 

-Y‏ ما هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 

-Y‏ هل تعتقد أن شركات التجارة الإلكترونية تعتبر في وضع أفضل للاستفادة من 
فوائد التحليلات؟ ibg‏ وكيف؟ 
Sources: From Heightening customer loyalty and optimizing channels, SAS,‏ 
Customer Success Stories.sas.com/success/lotte.html (accessed March 2013).‏ 


Copyright © 2016 SAS Institute Inc., Cary, NC, USA. Reprinted with permission. 
All rights reserved. 
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أسئلة مراجعة على القسم A-0‏ 

0- ما هو محرك البحث؟ lbg‏ تهتم الشركات اليوم محركات البحث؟ 

1- ما هو زاحف الويب $Web crawler‏ وفيم يُستخدم؟ وكيف يعمل؟ 

۷ ما هو ”تحسين محرك البحث؟“ ومن الذي يستفيد منه؟ 

-A‏ ما هي الأشياء التي يمكن أن تساعد صفحات الويب على احتلال ترتيب أعلى في نتائج محرك البحث؟ 


4-0 التنقيب في استخدام الويب (تحليلات الويب): 

التنقيب في استخدام الويب (ويس مى أيًا تحليلات الويب) هو استخراج معلومات مفيدة 
من البيانات التي يتم إنشاؤها من خلال زيارات صفحة الويب والمعاملات. ويمكن أن يساعدنا 
تحليل المعلومات التي يتم جمعها بواسطة خوادم الويب على فهم سلوك المستخدم بشكل أفضل. 
وغالبًا ما يطلق على تحليل هذه البيانات تحليل مسار النقر. وقد تتمكن الشركة من تمبيز أنماط 
مثيرة للاهتمام من مسار النقرء وذلك من خلال استخدام تقنيات التنقيب في البيانات والنصوص. 
فعلى سبيل «JULI‏ قد تعلم أن >1١‏ من الزائرين الذين بحثوا عن ”فنادق في مأوى“ قد بحثوا 
في وقت سابق عن ”رحلات جوية إلى مأوى“. هذه المعلومات قد تكون مفيدة في تحديد مكان 
وضع الإعلانات عبر الإنترنت. كما أن تحليل مسار النقر قد يكون مفيدًا Lá‏ في معرفة وقت 
وصول الزائرين إلى الموقع. فمثلا إذا كانت إحدى الشركات تعرف أن XVe‏ من تنزيلات البرامج 
من موقعها على الويب قد حدثت بين الساعة السابعة والحادية عشرة Las‏ فإنها قد تخطط 
للوصول إلى دعم أفضل للعملاء وسعة تحميلية أعلى للشبكة أثناء تلك الفترة. ويعرض الشكل 
(Y-0)‏ عملية استخراج المعرفة من بيانات مسار النقر وكيف يتم استخدام تلك المعرفة لتحسين 
كل من العملية وموقع الويبء والأكثر أهمية هو رفع قيمة العميل. 



































إستخراج المعرفة بيات ما قبل المعالجة 5 

إنماط الإستخدام جمع المستخدم 
ملفات تعريف المستخدمين pM‏ االعميل 
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: تحديد مشاهداث الصفحة 
P‏ 2 تحديد الزيارات Em‏ 
كيفية تحسين موقع الويب 
1 كيفية رفع قيمة العميل 











الشكل :٠١-١‏ استخراج المعرفة من بيانات استخراج الويب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري £44 


الفصل الخامس 


تقنيات تحليلات الويب: 

هناك العديد من الأدوات والتقنيات لتحليلات الويب في السوق. وتزداد شعبية أدوات تحليل 
بيانات الإنترنت» نظرًا لقدرتها على قياس بيانات الإنترنت وجمعها وتحليلها لفهم الاستخدام الأمثل 
للويب وتحسينه. وتبشر تحليلات الويب بإحداث ثورة في كيفية إنجاز الأعمال على الويب» كما 
يمكن استخدامها كأداة للأعمال التجارية الإلكترونية وأبحاث السوق ولتقييم وتحسين فعالية مواقع 
الويب الخاصة بالتجارة الإلكترونية. ويمكن لتطبيقات تحليلات الويب LA‏ مساعدة الشركات في 
قياس نتائج الحملات الإعلانية المطبوعة أو الإذاعية التقليدية. وبالإضافة إلى ذلك فإنه يمكنها أن 
تساعد في تقدير كيفية تغير حركة js ll‏ إلى موقع ويب بعد إطلاق حملة إعلانية جديدة. كما 
توفر تحليلات الويب معلومات حول عدد الزائرين بموقع الويب وعدد مشاهدات الصفحة, فضلا 
عن مساعدتها في قياس اتجاهات الحركة والرواج» والتي يمكن استخدامها في أبحاث السوق. 

وهناك فئتان رئيستان لتحليلات الويب وهما: خارج ال موقح» وقي الموقع. وتشر تحليلات 
الويب خارج الموقع إلى قياس الويب والتحليلات عنك وعن منتجاتك التي تتم خارج موقع الويب 
الخاص بك» وهو يشمل قياس نسبة المتابعين المحتملين موقع الويب (احتمال أو dio‏ ومشاركة 
الصوت (الرؤية أو الكلام الشفهي). والضجيج (التعليقات أو الآراء) الذي يحدث على الإنترنت. 

وقد كانت تحليلات الويب في الموقع هي الأكثر شيوعًا. فمن الناحية التاريخيةء أشارت تحليلات 
الويب إلى قياس نسبة زائري الموقع. ومع US‏ فقد Jelas‏ هذا الأمر في السنوات الأخيرة» ويرجع 
ذلك بشكل أساسي إلى أن الموردين ينتجون أدوات تمتد لتشمل كل الطبقات. وتقيس تحليلات 
الويب في الموقع سلوك الزائرين عندما يكونون على موقع الويب الخاص «b‏ ويشمل ذلك برامج 
التشغيل والتحويلات Lo-‏ درجة ارتباط الصفحات المقصودة المختلفة, بالمشتريات عبر الإنترنت. 
كما تقوم تحليلات الويب الموجودة في اللوقع بقياس أداء موقع الويب الخاص بك في سياق تجاري 
ثم تتم مقارنة البيانات المجمعة على موقع الويب بمؤشرات الأداء الرئيسة للأداء واستخدامها في 
تحسين استجابة الجمهور للوقع الويب أو حملة التسويق. وعلى الرغم من أن Google Analytics‏ 
هي خدمة تحليلات الويب الأكثر استخدامًا على نطاق واسع, إلا أن خدمة Yahoo‏ ومايكروسوفت» 
والأدوات الجديدة والأفضل التي تظهر باستمرارء توفر طبقات إضافية من ا معلومات. 

وبالنسبة إلى تحليلات الويب في ال موقع» فهناك طريقتان تقنيتان لجمع البيانات. وتتمثل 
الطريقة الأولى والأكثر تقليدية في تحليل ملف سجل الخادم» حيث يقوم خادم الويب بتسجيل 
طلبات الملفات التي تقدمها المتصفحات. وأما الطريقة الثانية فتتمثل في وضع العلامات على 
الصفحات, والتي تستخدم JavaScript‏ مضمتًا في شفرة صفحة الموقع لتقديم طلبات الصور إلى 
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خادم مخصص للتحليلات تابع لجهة خارجية كلما تم عرض صفحة من خلال متصفح الويب (أو 
عند حدوث نقرة ماوس). ولإنتاج تقارير المرور على شبكة الإنترنت. هكن معالجة كل من جمع 
البيانات فضلًا عن هذين المسارين الرئيسينء كما هكن أيضًا إضافة مصادر بيانات أخرى لزيادة 
بيانات سلوك موقع الويب. وقد تتضمن هذه المصادر الأخرى البريد الإلكترونيء أو بيانات حملة 
البريد المباشر, أو المبيعاتء أو تاريخ القيادة, أو البيانات التي colo‏ عبر وسائل التواصل الاجتماعي. 
مقاييس تحليلات الويب: 
توفر برامج تحليلات الويب الوصول إلى الكثير من البيانات التسويقية القيّمة, والتي يمكن الاستفادة 
منها للحصول على إحصاءات أفضل لتنمية أعمالك وتوثيق عائد الاستثمار (ROI)‏ بشكل «Jail‏ وذلك 
باستخدام مجموعة متنوعة من jalas‏ البيانات. ويمكن استخدام البصيرة والذكاء المكتسبة من 
تحليلات الويب لإدارة الجهود التسويقية للمؤسسة ومختلف منتجاتها أو خدماتها بفعالية. وتوفر 
برامج تحليلات الويب بيانات بشكل فوري 3 o‏ والتي يمكنها توثيق نجاحات حملاتك التسوبقية. أو 
تمكينك من إجراء تعديلات في الوقت المناسب على إستراتيجيات التسويق الحالية. 
ds‏ حين أن تحليلات الويب توفر نطاقًا واسعًا من المقاييس» فهناك أربع فئات من المقاييس قابلة 
للتطبيق بشكل عام ويمكن أن تؤثر بشكل مباشر على أهداف أعمالك )2013 The Westover Group,‏ 
وتشمل هذه الفئات ما يلي: 
- سهولة استخدام موقع الويب: كيف كانوا يستخدمون الموقع الخاص بي على الويب؟ 
- مصادر الزيارات: من أين أتوا؟ 
- ملامح الزوار: كيف يبدو زوار موقعي؟ 
- إحصائيات التحويل: ماذا يعني كل هذا للأعمال؟ 
قابلية استخدام موقع الويب: 
بداية من موقع الويب الخاص «tb‏ دعنا نلقي نظرة على مدى نجاحه مع زوارك. فهذا هو 
المكان الذي يمكنك من خلاله معرفة مدى «سهولة استخدامه» بالفعل أو ما إذا كان المحتوى 
الذي يقدمه مناسبًا el‏ لا. 
-١‏ استعراضات الصفحة: وهو أبسط القياسات» ويتم تقديم هذا المقياس Sole‏ على أنه ”متوسط 
عدد مشاهدات الصفحة لكل زائر“. فإذا جاء الأشخاص إلى موقعك على الويب وم يشاهدوا 
العديد من الصفحات» فقد يواجه موقعك الإلكتروني مشكلات في تصميمه أو بنيته. وهناك 
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تفسير آخر لانخفاض عدد مشاهدات الصفحة وهو قطع الرسائل التسويقية التي جلبتها إلى 
الموقع وا محتوى المتاح بالفعل. 

-Y‏ الوقت على الموقع: ويشبه مرات مشاهدة الصفحةء فهو مقياس أساسي لتفاعل الزائر مع 
موقع الويب الخاص بك. وبشكل cele‏ فكلما زاد إنفاق الشخص على موقع الويب الخاص 
به» كان ذلك أفضل. وقد يعني ذلك أنهم يراجعون المحتوى الخاص بك cols‏ مستخدمين 
المكونات التفاعلية اممتوفرة لديك والبناء للوصول إلى قرار مستنير للشراء أو الاستجابة أو 
اتخاذ الخطوة التالية التي قدمتها. وعلى العكس من ذلكء فإنه يجب UA]‏ فحص الوقت 
المستغرق في الموقع مقابل عدد الصفحات التي تم عرضها للتأكد من أن الزائر لا يقضي وقته 
في محاولة العثور على محتوى يسهل الوصول إليه. 

*- التنزيلات: يتضمن ذلك ملفات PDF‏ ومقاطع الفيديو والموارد الأخرى التي توفرها لزائريك. 
ولا بد أن تضع في اعتبارك مدى سهولة الوصول إلى هذه العناصر وكذلك مدى الترويج لها. 
as‏ إذا كانت إحصائيات الويب الخاصة بك تكشف أن ZT‏ من الأفراد الذين يشاهدون 
فيديو تجريبي يقومون LÉ‏ بعملية شراء فحينئذ سترغب في وضع إستراتيجية لزيادة نسبة 
المشاهدة لهذا الفيديو. 

-E‏ خريطة النقر: يمكن لمعظم برامج التحليلات عرض النسبة المئوية للنقرات التي حصل عليها 
كل pais‏ على indo‏ الويب الخاصة بك. ويتضمن هذا صورًا قابلة للنقرء وروابط نصية في 
نسختككء وتنزيلات» وبالطبع LAT‏ أي تنقل قد يكون لديك على الصفحة. هل يقومون بالنقر 
على العناصر الأكثر أهمية؟ 

0- مسارات النقر: على الرغم من أن تقييم مسارات النقر ينطوي على مزيد من المشاركة إلا 
أنه iSc‏ الكشف بسرعة أين هكن أن تفقد الزوار في عملية محددة. ويستخدم موقع ويب 
المصمم بشكل جيد مزيجًا من بنية الرسومات والمعلومات لتشجيع الزائرين على اتباع المسارات 
”المحددة مسبقًا“ من خلال gigo‏ الويب الخاص بك. وهذه المسارات ليست صلبة ولكنها 
خطوات بديهية تنوافق مع مختلف العمليات التي قمت بإنشائها في موقع الويب. وقد تكون 
إحدى هذه العمليات هي ”تعليم“ الزائر الذي لديه df‏ فهم لمنتجك أو خدمتك. وقد تكون 
الأخرى عملية ”تحفيز“ للزائر الذي يعيد النظر مرة أخرى في تحديث أو إعادة شراء. أما 
العملية الثالثة فقد يتم تنظيمها حول العناصر التي تسوقها عبر الإنترنت. وسوف يكون لديك 
العديد من مسارات العمليات في موقع الويب الخاص بك كما يكون لديك الجماهير المستهدفة 
والمنتجات والخدمات» ويمكن قياس كل منها من خلال تحليلات الويب لتحديد مدى فعاليتها. 
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مصادر الزيارات: 

برنامج تحليلات الويب الخاص بك هو أداة لا تصدق لتحديد مكان الزيارات الخاصة بك على 
الويب. ويتم تصنيف الفئات الأساسية مثل محركات البحث ومواقع الويب المرجعية والزيارات 
من الصفحات التي تم وضع إشارة عليها (مثل: المباشرة) مع القليل من مشاركة المسوق. كما 
يمكنك lái‏ تحديد زيارات الويب التي تم إنشاؤها بواسطة حملاتك الإعلانية المتعددة غير 
المتصلة أو عبر الإنترنت» بقليل من الجهد. 


-١‏ مواقع الويب التي تقوم بإحالة الزائرين إلى موقع الويب الخاص بك :Referral‏ إن مواقع 
الويب التي تحتوي على روابط تقوم بإرسال الزائرين مباشرةً إلى موقع الويب الخاص بك 
تعتبر مواقع ويب مرجعية» وسيقوم برنامج التحليلات الخاص بك بتحديد كل موقع يتم 
إرسال الزيارة لك منهء كما يوجد تحليل أعمق سيساعدك على تحديد الإحالات التي تنتج 
الحجم الأكبرء والتحويلات «eSI‏ والزوار الأحدثء وما إلى ذلك. 

-Y‏ محركات البحث: يتم تقسيم البيانات في فئة محركات البحث بين البحث مدفوع الثمن 
والبحث الأساسي (أو الطبيعي). ويمكنك مراجعة أهم الكلمات المفتاحية التي أنتجت الزيارة 
إلى موقعك ومعرفة ما إذا كانت هذه الكلمات تمثل منتجاتك وخدماتك أم لا. واعتمادًا 
على عملك قد ترغب في الحصول على مئات (أو آلاف) الكلمات المفتاحية التي تحدد ملامح 
العملاء المحتملين. وحتى أبسط بحث عن المنتج يمكن أن يكون بمتغيرات تعتمد على شكل 
العبارات الفردية في طلب البحث. 

*- المباشرة: وتنسب عمليات البحث المباشرة إلى مصدرين. يتمثل الأول في الشخص الذي يضع 
إشارة مرجعية على إحدى صفحات الويب الخاصة بك في صفحاته المفضلة ويضغط على هذا 
الرابط فيتم تسجيله كبحث مباشر. أما المصدر الثاني فيتمثل في كتابة شخص ما لعنوان URL‏ 
الخاص بك مباشرة في متصفحه. ويحدث هذا عندما يسترد شخص ما عنوان URL‏ الخاص بك 
من بطاقة أعمال أو كتيب أو إعلان مطبوع أو إعلان راديو وما إلى US‏ وهذا هو السبب في 
كونها إستراتيجية جيدة لاستخدام عناوين URL‏ المشفرة. 

AI حملات ليست عبر الإنترنت: إذا كنت تستخدم خيارات الإعلان إلى جانب الحملات‎ -E 
على الويب» فيمكن لبرنامج تحليلات الويب الخاص بك التقاط بيانات الأداء إذا قمت بتضمين‎ 
المخصص‎ URL آلية لإرسالها إلى موقع الويب الخاص بك. وعادةً ما يكون هذا العنوان‎ 
(C www.mycompany.com/offer50" الذي قمت بتضمينه في الإعلان الخاص بك (مثل:‎ 
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هو العنوان الذي يقدم هؤلاء الزوار لصفحة معينةء ويصبح لديك الآن بيانات حول عدد 
المستجيبين لذلك الإعلان عن طريق زيارة موقع الويب الخاص بك. 

0- حملات عبر الإنترنت: إذا كنت تعتمد على اللافتات الإعلانية» أو إعلانات على محرك بحثيء أو 
حتى حملة بريد إلكترونيء فيمكنك قياس فعالية تلك الحملات الفردية بمجرد استخدام عنوان 
URL‏ مخصص مشابه لإستراتيجية الحملة التي لا تعتمد على الإنترنت. 


الملفات الشخصية للزوار: 
وهي إحدى الطرق التي يمكنك من خلالها الاستفادة من تحليلات الويب الخاصة بك وتحويلها 

إلى أداة تسويقية حقيقية وذلك من خلال التقسيم إلى شرائح. ومن خلال مزج البيانات من تقارير 

التحليلات ال مختلفةء ستبدأ في مشاهدة مجموعة متنوعة من الملفات الشخصية للمستخدمين. 

-١‏ الكلمات المفتاحية: فمن خلال تقرير التحليلات الخاص بكء يمكنك معرفة الكلمات المفتاحية 
التي يستخدمها الزوار في محركات البحث لتحديد موقع الويب الخاص بك. فإذا قمت بتجميع 
كلماتك الرئيسة بسمات مشابهة» فإنك ستبدأ في رؤية مجموعات مميزة من الزوار تستخدم 
موقع الويب الخاص بك. فمثلا هكن أن تشير عبارة البحث المحددة التي تم استخدامها إلى 
مدى فهمهم لمنتجك أو فوائده. وإذا استخدموا الكلمات التي تعكس وصف المنتج أو الخدمة 
الخاصة بكء فهذا يعني أنهم قد يكونون بالفعل على علم بالعروض الخاصة بك من الإعلانات 
الفعالة والكتيبات وما إلى ذلك. وإذا كانت الشروط أكثر عمومية بطبيعتها فإن زائرك يبحث 
عن حل ممشكلة ما وقد حصل على موقع الويب الخاص بك. وإذا كانت هذه المجموعة الثانية 
من الباحثين كبيرة الحجمء فإنك ستحتاج إلى التأكد من أن موقعك يحتوي على مكون تعليمي 
قوي لإقناعهم بأنهم قد وجدوا إجابتهم ومن ثم نقلهم إلى قناة مبيعاتك. 

-Y‏ تجمعات المحتوى: فمن خلال الاعتماد على LAS‏ تجميع المحتوى الخاص «tb‏ قد تتمكن من 
تحليل أقسام موقع الويب الخاص بك والتي تتوافق مع منتجات وخدمات وحملات وأساليب 
تسويقية أخرى. فإذا كنت تدير الكثير من المعارض التجارية وزادت الزيارات إلى موقع 
الويب الخاص بك oo‏ عن المنشورات الخاصة eie‏ معينء OB‏ تحليلات الويب الخاصة بك 
سوف تقوم بتسليط الضوء على النشاط في ذلك القسم. 

-Y‏ الجغرافيا: حيث تسمح لك التحليلات بمعرفة المكان الذي تنبع منه الزيارات dl so‏ ها في 
ذلك البلد والولاية والمدينة. وقد يكون هذا مفيدًا بالنسبة لك خاصةً إذا كنت تستخدم حملات 
تستهدف مواقع جغرافية معينة أو كنت تريد قياس مشاهداتك في منطقة ما. 
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£- فترات اليوم: baled‏ ما تصل زيارات الويب إلى ذروتها في بداية يوم العمل وخلال وقت الغداء 
ds‏ نهاية يوم العمل. ومع «US‏ وليس من المعتاد إيجاد زيارة قوية إلى موقع الويب الخاص 
بك في وقت متأخر من المساء. ويمكنك Jelos‏ هذه البيانات لتحديد مواعيد تصفح الناس في 
مقابل الشراء Las‏ اتخاذ القرارات بشأن الساعات التي يجب أن تقدم فيها خدمة العملاء. 

0- خصائص صفحات مطلوبة للبحث: فإذا قمت بتنظيم حملاتك الإعلانية المختلفة بشكل 
صحيح» فإنه يمكنك توجيه كل مجموعة من مجموعاتك المستهدفة إلى صفحة مقصودة 
مختلفةء والتي ستقوم تحليلات الويب الخاصة بك بالتقاطها وقياسها. ومن خلال الجمع بين 
هذه الأرقام والتوزيعات السكانية لوسائل الحملة الخاصة بكء يمكنك معرفة النسبة المئوية 
للزوار التي تناسب كل فئة سكانية. 


إحصائيات التحويل: 
سوف تقوم كل منظمة بتعريف «التحويل» وفقًا للأهداف التسويقية الخاصة بها. وتستخدم 

بعض برامج التحليلات مصطلح هدف (goal)‏ لقياس أهداف موقع ويب معينء سواء كان ذلك عددًا 

na‏ من الزائرين لصفحة ما أو نموذج تسجيل تام أو عملية شراء عبر الإنترنت. 

-١‏ الزوار الجدد: فإذا كنت تعمل على زيادة مستوى الرؤية» فإنك ستحتاج إلى دراسة المؤشرات 
في بيانات الزائرين caedi‏ حيث يصنف برنامج التحليلات جميع الزوار على أنهم إما جُدد أو 
مترددين على gi‏ 

-Y‏ رجوع الزوار: فإذا كنت تشارك في برامج الولاء أو تقدم منتجًا يحتوي على دورة شراء طويلة, 
فستساعدك بيانات زوارك العائدين في قياس التقدم في هذا المجال. 

-Y‏ القيادات: فبمجرد تقديم نموذج وتوليد صفحة شكرء فإنك بذلك قد تكون جذبت 3B‏ حيث 
تسمح لك تحليلات الويب بحساب معدل الإكمال (أو معدل التخلي) عن طريق قسمة عدد 
النماذج المكتملة على عدد زائري الويب الذين جاءوا إلى صفحتك. وتشير النسبة المئوية 
للإكمال المنخفض إلى أن الصفحة تحتاج إلى الاهتمام. 

-E‏ المبيعات / التحويلات: اعتمادًا على هدف موقع الويب الخاص بكء يمكنك تحديد ”البيع“ من 
خلال صفقة عبر الإنترنت» أو تسجيل مكتملء أو تقديم عبر الإنترنت» أو أي عدد من أنشطة الويب 
الأخرى. ومراقبة هذه الأرقام سوف تنبهك إلى أي تغييرات (أو نجاحات!) تحدث في مراحل أعلى. 

0- معدلات المغادرة / الخروج: وهي لا تقل أهمية عن معدلات التحرك من موقع الويب الخاص 
بك ويقصد بها معدلات الأشخاص الذين بدأو عملية التحرك ف الموقع ثم قاموا بإنهائهاء أو 
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وصلوا إلى موقع الويب الخاص بك وتركوه بعد صفحة أو اثنتين. ففي الحالة الأولى» ستحتاج 
إلى تحليل المكان الذي أنهى فيه الزائر العملية وما إذا كان هناك عدد من الزائرين يغادرون 
في المكان نفسه. ومن تم التحقيق في الوضع من أجل اتخاذ القرار. وفي الحالة الأخيرة يشير 
معدل الخروج المرتفع من موقع ويب أو صفحة ما بشكل عام إلى وجود مشكلة في التوقعات. 
ويقوم الزائرون بالنقر على موقع الويب الخاص بك استنادًا إلى بعض الرسائل الواردة في الإعلان» 
والعرض التقديميء وما إلى EUS‏ ومن المتوقع استمرار هذه الرسالة بعض الوقت. وينبغي عليك 
أن تتأكد من أنك تعلن الرسالة التي يستطيع موقعك على الويب أن يعززها ويسلمها. 
ويتضمن كل بند من هذه العناصر مقاييس يمكن إنشاؤها لمؤسستك. كما يمكنك إنشاء 
لوحة معلومات أسبوعية تتضمن أرقامًا أو نسبًا محددة تشير إلى المكان الذي تنجح فيه - 
أو تلط الضوء على التحدي التسويقي الواجب معالجته. وعندما يتم تقييم هذه المقاييس 
باستمرار واستخدامها مرتبطةً ببيانات تسويقية أخرى dolio‏ فمن الممكن أن يقودك ذلك إلى 
برنامج تسويق كمي للغاية. ويعرض الشكل )16-0( لوحة تحكم في تحليلات الويب تم إنشاؤها 
باستخدام أدوات Google Analytics‏ المتاحة مجانًا. 
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أسئلة مراجعة على القسم 1-0: 

-١‏ ما هي الأنواع الثلاثة للبيانات التي يتم توليدها من خلال زيارات صفحة الويب؟ 
-Y‏ ما هو تحليل مسار النقر؟ وفيم يستخدم؟ 

*- ما هي التطبيقات الرئيسة للتنقيب في الويب؟ 

-٤‏ ما هي مقاييس تحليلات الويب شائعة الاستخدام؟ وما أهمية المقاييس؟ 


٠٠-٥‏ التحليلات الاجتماعية: 

يتفاوت معنى التحليلات الاجتماعية من شخص لآخر, bs‏ لنظرته إلى العالم» وإلى مجال 
دراسته. فعلى سبيل JÈU‏ يشير تعريف القاموس للتحليلات الاجتماعية إلى وجهة نظر فلسفية 
وضعها المؤرخ والفيلسوف الدهماري Lars-Henrik Schmidt‏ في تمانينيات القرن العشرين. 
ويعد الهدف النظري من وجهة النظر هذه هو «Socius‏ وهو نوع من ”الشمولية“ التي لا تمثل 
حسابًا عالميًا ولا مشاركة مجتمعية بين كل عضو في كيان ما )1996 (Schmidt.‏ وهكذاء تختلف 
التحليلات الاجتماعية عن كل من الفلسفة التقليدية وعلم الاجتماع والتي قد ينظر إليها على أنها 
المحاولات الرامية إلى توضيح الخلاف بين الفلسفة وعلم الاجتماع. 

ويختلف تعريفنا للتحليلات الاجتماعية إلى حد ما. فبدلًا من التركيز على الجزء «الاجتماعي» 
GS)‏ هو الحال في التعريف الفلسفي 4( فنحن نهتم أكثر بجزء «التحليلات» في المصطلح. وقد 
قامت شركة Gartner‏ (وهي شركة استشارية عالمية معروفة في مجال تقنية المعلومات) بتعريف 
التحليلات الاجتماعية على lil‏ «رصد وتحليل وضبط وتفسير التفاعلات الرقمية والعلاقات بين 
الأشخاص والمواضيع والأفكار والمحتوى» (gartner.com/it-glossary/social-analytics/)‏ 
وتشمل التحليلات الاجتماعية التنقيب في محتوى النص الذي تم إنشاؤه في وسائل التواصل 
الاجتماعي (مثل تحليل المشاعرء ومعالجة اللغات الطبيعية (NLP‏ وتحليل الشبكات الاجتماعية 
Jia)‏ تحديد المؤثرء والتنميط. والتنبؤ) وذلك بغرض الحصول على إحصاءات حول السلوكيات 
الحالية وا مس تقبلية للعملاء الحاليين وا محتملينء وحول شعورهم بالإعجاب أو عدم الإعجاب 
تجاه منتجات وخدمات الشركة. واستنادًا إلى هذا التعريف والممارسات الحالية: هكن تصنيف 
التحليلات الاجتماعية إلى فرعين مختلفين - غير أنه ليس بالضرورة أن يكون هذين الفرعين 
حصريين - وهما: تحليل الشبكات الاجتماعية (SNA)‏ وتحليلات وسائل التواصل الاجتماعي. 
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تحليل الشبكة الاجتماعية: 
تعتبر الشبكة الاجتماعية هيكل اجتماعي يتكون من أفراد / أشخاص sl)‏ مجموعات من 
الأفراد أو المنظمات) ترتبط ببعضها البعض بنوع من الروابط / العلاقات؛ حيث يقدم منظور 
الشبكة الاجتماعية طريقة شاملة لتحليل بنية وديناميكيات الكيانات الاجتماعية. وتستخدم 
دراسة هذه الهياكل نظام الحسابات القومية لتحديد الأنماط المحلية والعامميةء وتحديد الكيانات 
المؤثرة. ودراسة ديناميكية الشبكة. والجدير بالذكر أن الشبكات الاجتماعية وتحليلها هي في 
الأماس مجال متعدد التخصصات نشا من علم النفس الاجتماعيء وعلم الاجتماع؛ والإحصاءات» 
ونظرية الرسم البياني. ويعود تاريخ تطوير وإضفاء الطابع الرسمي على المدى الرياضي لنظام 
الحسابات القومية إلى الخمسينيات» في حين أن تاريخ تطوير النظريات والأساليب الأساسية 
للشبكات الاجتماعية يعود إلى ثمانينيات القرن العشرين(2003 axis. (Scott & Davis,‏ نظام 
الحسابات القومية الآن واحداً من النماذج الرئيسة في تحليلات الأعمالء وذكاء المستهلك وعلم 
الاجتماع المعاصرء كما يستخدم LA)‏ في عدد من العلوم الاجتماعية والرسمية الأخرى. 
إن الشبكة الاجتماعية هي بنيان نظري مفيد في العلوم الاجتماعية لدراسة العلاقات بين 
الأفراد والجماعات «ollis‏ أو حتى مجتمعات بأكملها (الوحدات الاجتماعية). ويستخدم 
المصطلح لوصف البنية الاجتماعية التي تحددها مثل هذه التفاعلات» حيث تمثل الروابط التي 
ترتبط بها أي وحدة اجتماعية معينة تقارب مختلف جهات التواصل الاجتماعي لتلك الوحدة. 
وبشكل «ele‏ فإن الشبكات الاجتماعية ذاتية التنظيم, ناشئة ومعقدة بحيث يظهر نمط متماسك 
le‏ من التفاعل المحلي للعناصر (الأفراد ومجموعات الأفراد) التي تشكل النظام. 
وفيما يلي بعض أنواع الشبكات الاجتماعية النموذجية المرتبطة بأنشطة الأعمال: 
- شبكات الاتصالات: تُعتبر دراسات الاتصال في الغالب جزءًا من JS‏ من العلوم الاجتماعية 
والإنسانيةء وتعتمد إلى حد كبير على مجالات مثل ele‏ الاجتماع وعلم النفس وعلم الإنسان 
(الأنثروبولوجي) وعلم المعلومات والأحياء (البيولوجي) والعلوم السياسية والاقتصاد. وتفيد 
العديد من مفاهيم الاتصالات في وصف عملية نقل المعلومات من مصدر إلى آخر وبالتالي يمكن 
تمثيلها كشبكة اجتماعيةء حيث تستفيد شركات الاتصالات من هذا المصدر الغني بالمعلومات 
لتحسين ممارسات الأعمال الخاصة بها وكذلك تحسين علاقات العملاء. 
- شبكات المجتمع: يشير مصطلح المجتمع تقليديًا إلى موقع جغرافي معين» وكانت دراسات العلاقات 
ا مجتمعية تتعلق بمن تحدثواء وترابطواء وتاجرواء وحضروا نشاطات اجتماعية مع بعضهم البعض. 
ومع ذلكء هناك اليوم مجتمعات ”إلكترونية“ موس ds‏ تم تطويرها من خلال أدوات التواصل 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


الاجتماعي وأجهزة الاتصالات. مثل هذه الأدوات والأجهزة تنتج باستمرار كميات كبيرة من 
لبيانات» والتي يمكن استخدامها من قبل الشركات لاكتشاف معلومات نفيسة وقابلة للتطبيق. 
- الشبكات الإجرامية: في ele‏ الجرهة وعلم الاجتماع المدن» تم توجيه اهتمام كبير للشبكات 
لاجتماعية من بين الممثلين الإجراميين. فمثلًاه قد تؤدي دراسة جرائم القتل التي تقوم 
بها العصابات والأنشطة غير القانونية الأخرى - باعتبارها سلسلة من عمليات التناوب بين 
لعصابات - إلى فهم أفضل لهذه الأنشطة الإجرامية ومن ثم العمل على منعها. والآن وبعد 
أن أصبحنا نعيش في عام مترابط إلى حد كبير (بفضل الإنترنت)» تقوم وكالات الأمن بمراقبة / 
متابعة الكثير من تشكيلات الشبكات الإجرامية وأنشطتها باستخدام أدوات وتكتيكات الإنترنت 
الحديثة. وعلى الرغم من أن الإنترنت قد غير شكل شبكات الإجرام والوكالات المنوطة بتطبيق 
القانونء إلا أن النظريات الاجتماعية والفلسفية التقليدية لا تزال تطبق إلى حد كبير. 

- شبكات الابتكار: تركز دراسات الأعمال على نشر الأفكار والابتكارات في بيئة الشبكات على انتشار 
لأفكار واستخدامها بين أعضاء الشبكة الاجتماعية. وتكمن الفكرة في فهم سبب كون بعض الشبكات 
أكثر Lla‏ وماذا تتبنّى بعض المجتمعات تلك الأفكار والابتكارات في وقت مبكر (مثل دراسة أثر 
هيكل الشبكة الاجتماعية في التأثير على انتشار الابتكار والسلوك الإبداعي). 





مقاييس تحليل الشبكة الاجتماعية: 
إن نظام تحليل الشبكة الاجتماعية SNA‏ هو الفحص المنتظم للشبكات الاجتماعية. وينظر نظام 
تحليل الشبكة الاجتماعية إلى العلاقات الاجتماعية من حيث نظرية الشبكة؛ والتي تتكون من عقد 
Lig) nodes‏ الأفراد أو المنظمات داخل الشبكة) والعلاقات / الاتصالات (التى تمثل العلاقات بين 
الأفراد أو المنظمات» مثل الصداقة أو القرابة أو الوضع التنظيمي). وغالبًا ما يتم تمثيل هذه الشبكات 
باستخدام الرسوم البيانية للشبكة الاجتماعية. حيث يتم تمثيل saal‏ (نقاط الالتقاء) كنقاط ويتم تمثيل 
الروابط كخطوط. وتقدم الحالة العملية (A-0)‏ مثالا مثيرًا للتحليلات الاجتماعية متعددة القنوات. 
حالة عملية A-0‏ 
فودكا تيتو تؤسس الولاء للعلامة التجارية بإستراتيجية اجتماعية حقيقية 
]15 كان على الفودكا المصنوعة يدويًا من تيتو Tito‏ تحديد مقياس واحد لوسائل 
التواصل الاجتماعي يعكس مهمتها بدقة أكبر. فربما يكون المشاركة. إن التواصل مع 
محبي الفودكا بطريقة شاملة وأصيلة هو أمر تأخذه تيتو Tito‏ بجدية بالغة. وتعكس 
الإستراتيجية الاجتماعية للعلامة التجارية تلك الرؤية. 
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وقد کان تأسيسها منذ ما يقرب من عقدين من الزمان» وقد ساعد ظهور وسائل 
التواصل الاجتماعي في تعزيز العلامة التجارية من خلال لعب دور أساسي في إشراك 
الجمهور وزيادة الوعي بالعلامة التجارية. وفي مقابلة مع صاحب اممشروع» ذكر 
أن Bert Beveridge‏ مؤسس شركة تيتو «11]0“. قد نسب الفضل لوسائل التواصل 
الاجتماعي لتمكينه من التنافس على مساحة العرض على الرفوف مع علامات تجارية 
أخرى للخمور أكثر شهرة. حيث قال Beveridge‏ لصاحب المشروع: ”وسائل التواصل 
الاجتماعي هي منصة كبيرة للترويج لعلامة تجارية من خلال الكلمة الشفوية. لأنها 
ليست فقط ممن لديه أكبر مكبر للصوت“. 

ومع نضج شركة تيتو Tito‏ ظل الفريق الاجتماعي مخلصًا للقيم التأسيسية للعلامة 
التجارية ويستخدم NS‏ من Instagrams Twitter‏ بنشاط لإجراء محادثات فردية 
وتواصل مع المتحمسين للعلامة التجارية. وقالت Katy Gelhausen‏ منسقة شبكة 
الإنترنت ووسائل التواصل الاجتماعي: ”نحن م ننظر أبدًا لوسائل التواصل الاجتماعي 
على اعتبار lgl‏ وسيلة أخرى للإعلان“. وتابعت: ”نحن موجودون على هذه الوسائل 
الاجتماعية حتى يتمكن عملائنا من التحدث إلينا“. 

وللوصول لهذه النهاية تستخدم تيتو Tito‏ وسائل التواصل الاجتماعي الحديثة 
لفهم جو الصناعة. وتطوير علامة تجارية اجتماعية متسقة. وإنشاء حوار ga‏ جمهورها. 
ونتيجة UU‏ فقد قامت تيتو Tito‏ بتنمية مجتمعاتها عضويًا على كل من Twitter‏ 
بنسبة Instagrams Z£Y,0‏ بنسبة XY,‏ وذلك في غضون ع أشهر. 


Titos O tea 


sproutsocal 
* 


Titos 








Handmade 








الإخبار بإستراتيجية التسويق ال موسمية المتكاملة: 

هثل برنامج كوكتيل الربع سنوي لتيتو Ie Tito‏ رئيس ا من إستراتيجية التسويق 
المتكاملة للعلامة التجارية؛ حيث يتم تطوير وصفة كوكتيل في كل ربع سنة وتوزيعها 
من خلال مبادرات التسويق عبر الإنترنت في تيتو Tito‏ 
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ومن امهم بالنسبة لتيتو Tito‏ ضمان توافق الوصفة مع تركيز العلامة التجارية فضلا 
عن الاتجاه إلى صناعة أكبر. Uig‏ تستخدم Gelhausen‏ الكلمات المفتاحية لعلامة 
Sprout‏ طراقبة اتجاهات الصناعة وملفات تعريف نكهة الكوكتيل. تقول :Gelhausen‏ 
Ai"‏ كان جهاز lol Sprout‏ مهمة جدًا للرصد الاجتماعي. وعد Inbox‏ طريقة جيدة 
للاحتفاظ بأعلى علامات التصنيف والاطلاع على المؤشرات العامة في جدول واحد“. 


ويتم تقديم هذه الدروس إلى فريق عمل المزيج الداخلي في تيتو Tito‏ واستخدامها لضمان 
توصيل نفس الوصفة الربع سنوية إلى فريق مبيعات العلامة التجارية وعبر قنوات التسويق. 
تقول :Gelhausen‏ ”سواء كنت تشرب تيتو Tito‏ في البار أو تشتريه من متجر لبيع الخمور 
أو تتابعنا على مواقع التواصل الاجتماعي فإنك تحصل على نفس الكوكتيل الربع سنوي“. 

يضمن البرنامج حصول الشخص على تجربة متسقة للعلامة التجاريةء في كل نقطة 
اتصال للمستهلك» وهذا الاتساق أمر حيوي. وف الواقع» فإنه وفقًا لدراسة أجرتها شركة 
Infosys‏ حول تجربة التسوق التي توفرها omnichannel‏ فإن XVE‏ من المستهلكين 
يرون أن الاتساق بين القنوات هو سبب إنفاقهم أكثر مع علامة تجارية. وعلى الجانب 
الآخر ذكر 19 أن التناقض يُعد سببًا CSS‏ لإنفاق مبالغ أقل. 

ويبدأ gae‏ رؤى الصناعة في شركة تيتو Tito‏ بمراقبة اجتماعية على Twitter‏ 
Instagrams‏ من خلال Sprout‏ غير أن الإستراتيجية الاجتماعية للعلامة التجارية لا 
تتوقف عند هذا الحد» حيث تستخدم تيتو Tito‏ النظام الأساسي بشكل يومي للتواصل 
led‏ مع عملائها. مع الحفاظ على جذورها. 

ويقوم صندوق البريد الذي في Sprout‏ بعرض حسابات Instagrams Twitter‏ 
الخاصة بتيتو Tito‏ في خلاصة واحدة ومتماسكة»ء مما يساعد Gelhausen‏ على إدارة 
الرسائل الواردة والتحديد بشكل سريع أي منها يتطلب استجابة. 

يقول :Gelhausen‏ “يتيح LJ‏ برنامج Sprout‏ البقاء على اتصال دائم بالمحادثات 
التي نجريها مع متابعينا. bls‏ أحب إمكانية التفاعل بسهولة مع المحتوى من حسابات 
متعددة في مكان "aos‏ 

انتشار الكلمة على تويتر: 

وعد الطريقة التي تتبعها تيتو Tito‏ على تويتر بسيطة. حيث إنها تتمثل في 
الانخراط في محادثات شخصية فردية مع امعجبين. ويعد الحوار قوة دافعة للعلامة 
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do lel‏ وعلى مدار € أشهرء كانت نسبة ۸۸ من التغريدات التي تم إرسالها تمثل 
ردودًا على الرسائل الواردة. 

وقد أدى استخدام Twitter‏ كخط اتصال بين تيتو Tito‏ ومعجبيها إلى زيادة التفاعل 
بنسبة Y, Y‏ بالإضافة إلى زيادة المتابعين بنسبة XEY,0‏ وما يثير الإعجاب أكثر هو 
إنهاء تيتو Tito‏ هذا الربع السنوي بواقع 0۳۸,۳١١‏ انطباعًا من الأعضاء - وهو ارتفاع 
بنسبة XM‏ كما يتم تطبيق إستراتيجية مشابهة على Instagram‏ حيث تستخدمها 
تيتو Tito‏ لتعزيز وتقوية العلاقة مع امعجبين وذلك من خلال نشر الصور ومقاطع 
الفيديو لأفكار الوصفات الجديدة وأحداث العلامة التجارية والمبادرات. 

الاستيلاء على الحفل على :nstagram‏ 

تقوم تيتو Tito‏ في الأماس بنشر محتوى نمط الحياة على Instagram‏ وتشجع 
المتابعين لدمج العلامة التجارية في ا مناسبات اليومية. كما تستخدم تيتو Tito‏ أيضًا 
النظام الأماسي للترويج لجهودها التسويقية ولإخبار قصة علامتها التجارية. ويعثر 
الفريق على قيمة في تقرير Instagram‏ الخاص > Sprout‏ والتي تساعدهم على 
تحديد أكثر الأشياء التي تحظى بالمشاركة على وسائل التواصل وتلقي أكبر قدر من 
التفاعل وتحليل تركيبة الجمهور ومدى زيادتهم. والغوص في أنماط النشر بشكل «asl‏ 
وتقييم أداء الوسم (hashtag)‏ الصادر. وفي هذا الصدد يقول :Gelhausen‏ ”في ضوء 
الخلاصة المخصصة الجديدة في Instagram‏ من المهم أن ننتبه U,‏ يحدث بالفعل“. 

وقد جمكنت تيتو Tito‏ باستخدام تقرير Instagram‏ من قياس أثر إستراتيجيتها 
التسويقية Instagram‏ وتعديل مقاربتها s‏ لذلك. ومن خلال استخدام الشبكة 
كطريقة أخرى للتفاعل مع ا معجبين» CF‏ علامتها التجارية بشكل مطرد مع نمو جمهورها. 
às‏ غضون € أشهر شهدت TitosVodkaG‏ زيادة في المتابعين بنسبة ZW‏ وزيادة في 
التفاعل بنسبة Y V,‏ کما حصل كل محتوى منشور على متوسط eus ٥۳٤‏ كما نما 
الوسم (hashtag)‏ الخاص بالعلامة التجارية titoshandmadevodka£‏ بنسبة AYY‏ 


من هنا يؤدي إلى أين؟ 

تعد وسائل التواصل الاجتماعي استثمارًا متواصلًا في الوقت والاهتمام. وستواصل 
تيتو Tito‏ النشاط الذي شهدته علامتها التجارية من خلال تقسيم كل ربع سنة 
في حملتها الخاصة. يقول :Gelhausen‏ ”نحن Lalo‏ نصبح أكثر ذكاءً من خلال 
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إستراتيجياتنا الاجتماعية ونحرص على أن يكون ما ننشره L‏ ونتلقى صداه“. وسيظل 
استخدام التواصل الاجتماعي مع المعجبين بطريقة ثابتة وأصلية ولا تنسى حجر الزاوية 
في جهود التسويق الرقمي للعلامة التجارية. وستواصل تيتو Tito‏ تعزيز مجتمع محبيها 
doyalists‏ باستخدام مجموعة أدوات إدارة وسائل التواصل الاجتماعي في „Sprout‏ 
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- توجد زيادة بنسبة ZVI‏ في التفاعل الأساسي على „Twitter‏ 
- وزيادة بنسبة ۸1> في الانطباعات الأساسية على "Twitter‏ 
- وزيادة بنسبة ZYV‏ في التفاعل على Instagram‏ 
أسئلة للمناقشة: 
-Y‏ كيف يمكن استخدام تحليلات وسائل التواصل الاجتماعي في صناعة المنتجات 
الاستهلاكية؟ 
-Y‏ ما هي في رأيك التحديات الرئيسة والحلول والنتائج المحتملة لتطبيق تحليلات 
وسائل التواصل الاجتماعي على المنتجات الاستهلاكية وشركات الخدمات؟ 
Source: SproutSocial Case Study, “Titos Vodka Establishes Brand insights/case-‏ 
studies/titos/(accessed July 2016).‏ 
ورور الأعوام» تم تطوير مقاييس (أو قياسات) مختلفة لتحليل هياكل الشبكات الاجتماعية 
من وجهات نظر مختلفة. وغالبًا ما يتم تجميع هذه المقاييس ضمن ثلاث فقات: الروابط 
والتوزيعات والتقسيم إلى قطاعات. 
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الروابط: 

حب الأشياء المتشابهة: وهو مدى قيام الجهات الفاعلة بتشكيل روابط مع آخرين بينهم 
تشابه مع غيرهم ممن يختلفون عنهم. ويمكن تعريف التشابه حسب الجنس أو النسب أو 
العمر أو المهنة أو التحصيل العلمي أو الحالة أو القيم أو أي سمة بارزة أخرى. 

التعدد: وهو عدد من نماذج المحتوى المضمنة في رابطء مثل: شخصين من الناس» وهما صديقانء 
بالإضافة إلى أنهما يعملان lka‏ مجموعة متعددة من اثنين. يرتبط التعدد بقوة العلاقة. 

تبادل العواطف / المعاملة بالمثل: هو مدى قيام اثنين من الممثلين بتبادل علاقات الصداقة أو 
غيرها من التفاعلات بين كل منهما. 

إغلاق الشبكة: وهو مقياس لإكمال العلاقات الثلاثيةء حيث إن افتراض الفرد لإغلاق الشبكة 
(أي أن أصدقاء أصدقائه هم أصدقاؤه أيضًا) يسمى التعدي Transitivity‏ والتعدي هو نتيجة 
للخاصية الفردية أو الظرفية للحاجة إلى الإغلاق الإدراي. 

التجاور: وهو الميل للحصول على مزيد من الروابط مع الآخرين ذوي الموقع الجغرافي المقرب. 


التوزيعات: 

الجسر: وهو الشخص الذي هلأ فجوة هيكلية عن طريق روابطه الضعيفة وهو الذي يوفر 
الرابط الوحيد بين فردين أو مجموعة. كما يتضمن LÉ‏ أقصر الطرق عندما يكون المدى الأطول 
غير ممكن بسبب وجود خطر كبير لتشويه الرسائل أو فشل التسليم. 

ا مركزية: وتشير إلى مجموعة من المقاييس التي تهدف إلى تحديد أهمية أو تأثير (في مجموعة 
متنوعة من الحواس) عقدة معينة (أو مجموعة) داخل الشبكة. ويوجد عدة طرق لقياس 
المركزية من أشهرها المركزية البينية» ومركزية التقارب» ومركزية القيمة الذاتيةء ومركزية ألفاء 
بالإضافة إلى مركزية الدرجة. 

الكثافة: وهي نسبة الروابط المباشرة في الشبكة بالنسبة إلى العدد الإجمالي الممكن. 

المسافة: وهي الحد الأدنى لعدد الروابط ال مطلوبة لربط جهتين محددتين. 

الثقوب الهيكلية: وهي غياب الروابط بين جزئين من الشبكة. حيث إن العثور على ثقب 
هيكلي واستغلاله من الممكن أن يؤدي إلى منح صاحب المشروع ميزة تنافسية. وقد تم تطوير 
هذا المفهوم من قبل عام الاجتماع Ronald Burt‏ ويشار إليه أحيانًا على أنه مفهوم بديل لرأس 
المال الاجتماعي. 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


قوة الربط: وتعرف lib‏ مزيج خطي من الوقتء والكثافة العاطفيةء والحميميةء والمعاملة 
بالمثل (أي التبادلية). وتترابط العلاقات القوية بكل من حب الأشياء المتشابهة: والتجاورء 
والتعديء في حين تترابط العلاقات الضعيفة مع الجسور. 


التقسيم إلى قطاعات: 

«sss والدوائر الاجتماعية: ويتم تعريف المجموعات على أنها زمر إذا كان كل فرد‎ , s 
بشكل مباشر بجميع الدوائر الفردية أو الاجتماعية الأخرى مع مستوى صرامة أقل من الاتصال‎ 
مجموعات متماسكة هيكليًا في حالة الرغبة‎ lil وهذا تعريف غير دقيق» أو تعرف على‎ c SUI 
مستوى دقة أكبر.‎ à 

معامل التجميع :(Clustering Coefficient)‏ وهو مقياس لاحتمال كون عضوين من العقدة 
مرتبطين. ويشير معامل التجميع الأعلى إلى درجة أكبر من الطائفية. 

التماسك: وهو مدى ارتباط الممثلين مباشرة ببعضهم البعض عن طريق روابط متماسكة. 
ويشير التماسك الهيكلي إلى الحد الأدنى لعدد الأعضاء الذين إذا تمت إزالتهم من مجموعة ما فإن 
ذلك من شأنه أن يؤدي إلى فك المجموعة. 


تحليلات وسائل التواصل الاجتماعي: 

تشير وسائل التواصل الاجتماعي إلى التقنيات sls Ml‏ للتفاعلات الاجتماعية بين الأشخاص 
الذين يقومون بإنشاء ومشاركة وتبادل المعلومات والأفكار والآراء في المجتمعات والشبكات 
الافتراضية» وهي عبارة عن مجموعة من تطبيقات البرامج المستندة إلى الإنترنت والتي تعتمد 
على الأسس الأيديولوجية والتقنية للويب Y,»‏ والتي تسمح بإنشاء وتبادل المحتوى الذي ينشئه 
المستخدم )2010 (Kaplan & Haenlein,‏ وتعتمد وسائل التواصل الاجتماعي على تقنيات 
المحمول وغيرها من التقنيات القائمة على الويب لإنشاء منصات تفاعلية بشكل قوي للأفراد 
والمجتمعات لمشاركة ال محتوى الذي ينشئه المستخدم وإنشاء المحتوى ومناقشته وتعديله. كما 
أنها تقدم تغييرات كبيرة في التواصل بين المنظمات والمجتمعات والأفراد. 

ومنذ ظهورها في أوائل التسعينيات شهدت تقنيات الشبكات الاجتماعية القانئمة على الويب 
تحسنًا S‏ في كل من الجودة والكمية. وتتخذ هذه التقنيات العديد من الأشكال Alex‏ 
Le‏ في ذلك المجلات عبر الإنترنت» ومنتديات الإنترنت» وسجلات الويب» والمدونات الاجتماعية, 
والمدونات الصغيرةء والويكي» والشبكات الاجتماعيةء والحلقات الصوتية «podcasts‏ والصورء 
والفيديوء وتقييمات / تصنيفات المنتجات / الخدمات. ومن خلال تطبيق مجموعة من النظريات 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oyo‏ 
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في مجال أبحاث وسائل التواصل (الحضور الاجتماعيء ثراء وسائل التواصل) والعمليات الاجتماعية 

(التقديم JIII‏ والإفصاح Ll lll‏ کل من Haenleins Kaplan‏ )2010( نظام تصنيف 

Slug)‏ التواصل الاجتماعي بست أنواع مختلفة منها : )١(‏ المشاريع التعاونية (مثل ويكيبيديا» 

(€) مجتمعات المحتوى (مثل: يوتيوب)‎ (Y) مدونات والمدونات الصغيرة (مثل تويتر).‎ (Y) 

مواقع الشبكات الاجتماعية (Facebook Jès)‏ )0( عام الألعاب الافتراضية (مثل: World of‏ 

Second Life اجتماعية افتراضية (مثل:‎ else (0) «(Warcraft 

وتختلف وسائل التواصل الاجتماعي القائمة على الويب عن وسائل التواصل التقليدية / الصناعية, 

مثل الجرائد والتلفاز, والأفلام» حيث إنها رخيصة نسبيًا ويمكن الوصول إليها لتمكين أي شخص 

(حتى الأفراد العاديين) من نشر أو الوصول إلى / استهلاك المعلومات. وتتطلب وسائل التواصل 

الصناعية عمومًا موارد مهمة لنشر المعلومات. حيث إن المقالات (أو الكتب) تمر في معظم 

الحالات بالعديد من التنقيحات قبل نشرها. وفيما يلي بعض الخصائص الأكثر انتشارًا التي تساعد 

على التمييز بين وسائل التواصل الاجتماعي والصناعي )2010 :(Morgan, Jones, & Hodges,‏ 

- الجودة: ففي مجال النشر الصناعي - بواسطة ناشر - فإن النطاق النموذجي للجودة يكون 
أضيق بشكل جوهري من الأسواق المتخصصة غير المغطاة. ويتمثل التحدي الرئيس الذي Al‏ 
المحتوى في مواقع الشبكات الاجتماعية في حقيقة أن توزيع الجودة له تباين كبير: من عناصر 
عالية الجودة إلى محتوى منخفض الجودة: وأحيانًا مُسيء. 

- الوصول: توفر كل من تقنيات وسائل التواصل الصناعي والاجتماعي BUS‏ واسعًا وقادرًا على 
الوصول إلى جمهور عالمي. ومع ذلك Šole‏ ما تستخدم وسائل التواصل الصناعي إطارًا مركزيًا 
للتنظيم والإنتاج والنشرء في حين أن وسائل التواصل الجتماعي بطبيعتها أكثر لامركزية وأقل 
تسلسلًا وتميرًا بنقاط متعددة للإنتاج واممنفعة. 

- التكرار: حيث إن تحديث وإعادة النشر على منصات وسائل التواصل الاجتماعي asd‏ أسهل 
وأسرع «uas ls‏ وذلك بالمقارنة مع وسائل التواصل الصناعية وبالتالي فإنه يمارس بشكل أكثر 
تكرارًاء مما يؤدي إلى الحصول على محتوى أعذب. 

- إمكانية الوصول: عادةً ما تكون وسائل الإنتاج الخاصة بوسائل التواصل الصناعية حكومية و / 
أو شركات (مملوكة ملكية خاصة) ومكلفةء في حين أن أدوات وسائل التواصل الاجتماعي متاحة 
للجمهور بشكل عام بتكلفة قليلة أو بدون تكلفة. 

- سهولة الاستخدام: يتطلب إنتاج وسائل التواصل الصناعية ole‏ مهارات متخصصة وتدريب. 
وعلى العكس من ذلكء فإن معظم إنتاج وسائل التواصل الاجتماعي لا يتطلب سوى إعادة 
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التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


تفسير متواضع للمهارات القائمة؛ ومن الناحية النظريةء فإن أي شخص لديه إمكانيةء يستطيع 
تشغيل وسائل إنتاج وسائل التواصل الاجتماعي. 

- فورية: قد يكون الفارق الزمني بين الاتصالات التي تنتجها وسائل التواصل الصناعية طويلًا 
(أسابيع أو شهور أو حتى سنوات) da‏ بوسائل التواصل الاجتماعي (التي هكن أن تكون 
قادرة على الاستجابة بصورة فورية (GE‏ 

- قابلية التحديث: لا يمكن تغيير وسائل التواصل الصناعية بمجرد إنشائها (مجرد طباعة مقالة 
المجلة وتوزيعهاء ولا يمكن إجراء تغييرات على نفس اللقالة)» في حين يمكن تغبير وسائل التواصل 
الاجتماعي على الفور تقريبًا من خلال التعليقات أو التحرير. 


كيف يستخدم الناس وسائل التواصل الاجتماعي؟ 

لا يقتصر نمو مواقع الشبكات الاجتماعية على عددها فحسب بل تنمو Ul‏ درجة ارتباطها 
بالقناة. وقد قدم كل من Bastones Brogan‏ )2011( نتائج بحث تقسم المستخدمين حسب مدى 
نشاطهم في استخدام وسائل التواصل الاجتماعي والتطور المتتبع لهذه القطاعات من المستخدمين 
بمرور الوقت. وقد أدرجوا ستة مستويات مشاركة مختلفة (الشكل .)١0-0‏ 
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مستوى إرتباط وسائل التواصل الإجتماعى 














شكل 10-0: تطور مشاركة مستخدم وسائل التواصل الاجتماعي 

ووفقًا لنتائج البحثء فقد كان مجتمع المستخدمين عبر الإنترنت يتحول بشكل متزايد باتجاه 
المشاركة هرمية الشكل. والتغير الملحوظ بشدة هو الحادث فيما بين غير النشطين» حيث تضم 
هذه الفئة ٤٤‏ من مستخدمي الإنترنت. وبعد ذلك بعامينء قفز أكثر من نصف هؤلاء الخاملين 
إلى وسائل التواصل الاجتماعي بشكل أو بآخر. وقد أشار Bastone‏ إلى أن: ”الآن حوالي XAY‏ 
من مس تخدمي الإنترنت البالغين ضمن واحدة من الفئات العلياء لقد وصلت وسائل التواصل 
الاجتماعي إلى حالة من (dl‏ الجماعي“. 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 
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وقال :Bastone‏ ”تشير وسائل التواصل الاجتماعي إلى الطرق المنهجية والعلمية لاستهلاك 
الكمية الهائلة من المحتوى الذي أنشأته وسائل التواصل الاجتماعي على شبكة الإنترنت, والأدوات 
والتقنيات من أجل تحسين قدرة المؤسسة على المنافسة. وقد أصبحت تحليلات وسائل التواصل 
الاجتماعي قوة جديدة في المنظمات حول العام بشكل سريع» مما يسمح لها بالوصول إلى 
المستهلكين وفهمهم كما م يحدث من قبل. وبالإضافة إلى «eS‏ فقد أصبحت وسائل التواصل 
الاجتماعي في العديد من الشركات» أداة للإستراتيجيات المتكاملة للتسويق والاتصالات. 

يوفر gal‏ الهائل لوسائل التواصل الاجتماعى» من المدونات. «jugis «Facebook‏ 
إلى LinkedIn‏ ويوتيوب» وأدوات التحليلات التي تستفيد من هذه المصادر الغنية بالبيانات» 
للمنظمات فرصة الدخول في محادثات مع ملايين العملاء حول العام كل يوم. وهذه الميزة هي 
السبب في أن ما يقرب من ثلثي الشركات ال ٠١٠١‏ التي شاركت في دراسة استقصائية حديثة - أجرتها 
هارفارد بيزنس ريفيو أناليتيكس سيرفيسز (Harvard Business Review Analytic Services)‏ 
- قالوا إنهم lal‏ يستخدمون cols: Ui‏ وسائل التواصل الاجتماعي أو لديهم خطط وسائل 
التواصل الاجتماعي في الأعمال )2010 (Harvard Business Review,‏ ولكن ما زال الكثيرون 
يقولون إن وسائل التواصل الاجتماعي هي تجربة حيث يحاولون فهم LAS‏ الاستخدام الأمثل 
للقنوات المختلفة, وقياس فعاليتهاء ودمج وسائل التواصل الاجتماعي في إستراتيجيتهم. 


قياس تأثير وسائل التواصل الاجتماعي: 
بالنسبة للمؤسسات - سواء كانت صغيرة أو كبيرة - فهناك إحصاءات قيّمة مخفية داخل 
المحتوى الذي أنشأه المستخدم على مواقع التواصل الاجتماعيء ولكن كيف هكنك أن تبرزها 
من بين عشرات مواقع المراجعة وآلاف المدونات والملایین من مشارکات Facebook‏ وملايين 
التغريدات؟ وإذا أمكنك القيام بذلك. فكيف تقيس تأثير جهودك؟ وهذه الأسئلة يمكن معالجتها 
من خلال تمديد التحليلات لتقنيات وسائل التواصل الاجتماعي. وبمجرد أن تحدد هدفك من 
وسائل التواصل الاجتماعي (ما تريد تحقيقه)» فإن هناك العديد من الأدوات لمساعدتك على 
الوصول إلى هذا الهدفء وهذه الأدوات التحليلية تقع عادةً في ثلاث فئات واسعة: 
- التحليلات الوصفية: تستخدم إحصائيات بسيطة لتحديد خصائص واتجاهات النشاط Jis‏ 
عدد المتابعين لديك» وعدد المراجعات التي تم إنشاؤها على Facebook‏ والقنوات التي يتم 
استخدامها في أغلب الأحيان. 
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التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


- تحليل الشبكات الاجتماعية: تتبع الروابط بين الأصدقاء والمعجبين والمتابعين لتحديد روابط 
التأثير بالإضافة إلى أكبر مصادر التأثير. 
- التحليلات المتقدمة: تتضمن تحليلات تنبؤية وتحليلات النصوص التي تدرس ال محتوى في 
المحادثات عبر الإنترنت لتحديد المواضيع والمشاعر والارتباطات التي لن يتم الكشف عنها من 
خلال المراقبة العرضية. 
وتستخدم الأدوات والحلول المتطورة لتحليلات وسائل التواصل الاجتماعي جميع فئات 
التحليلات الثلاث (أي: وصفية» تنبؤية» وقائية) بطريقة تدريجية إلى حد L‏ 


أفضل الممارسات في تحليلات وسائل التواصل الاجتماعي: 

باعتبارها أداة di cab‏ فإن تحليلات وسائل التواصل الاجتماعي تمارس من قبل الشركات بطريقة 
عشوائية بعض الشيء. ونظرًا لعدم وجود منهجيات راسخة» فإن الجميع يحاولون إنشاء منهجياتهم 
الخاصة عن طريق التجربة والخطأ. وفيما يلي بعض أفضل الممارسات التي تم اختبارها ميدانيًا لتحليلات 
وسائل التواصل الاجتماعي التي la» jl‏ كل من Chavess Paine‏ (2012). 

الاعتقاد ob‏ القياس نظام توجيه لا نظام تصويت: غالبًا ما تستخدم القياسات للعقاب 
أو المكافآت؛ ولا ينبغي أن تكون UIS‏ بل يجب أن يكونوا على معرفة بالأدوات وا ممارسات 
الأكثر فاعليةء وما يجب إيقافه لأنه لا يعملء وما يجب فعله أكثر لأنه يعمل بشكل جيد. 
ونظام التحليلات الجيد ينبغي أن يخبرك أين تحتاج إلى التركيز. وربما يكون كل هذا التركيز على 
Facebook‏ غير مهم OÙ‏ ذلك ليس مكان جمهورك» حيث إنه من الممكن أن يكونوا جميعهم 
على تويتر أو العكس. «Chavess Paine J sgg‏ فإن تفضيل القناة لن يكون بالضرورة Égi‏ 
يقول كل منهم: AU"‏ عملنا gW‏ مع فندق مم يكن لديه أي نشاط تقريبًا على Twitter‏ لعلامة 
تجارية واحدة غير أن لديه الكثير من أنشطة Twitter‏ لإحدى علاماتهم التجارية العالية“ وبدون 
أداة قياس دقيقةء فإنك لن تعرف. 

تتبع الشعور: يريد العملاء أن يأخذوا ما يسمعونه ويتعلمونه من المحادثات عبر الإنترنت 
ويعملون عليه. والمفتاح لذلك هو أن تكون دقيقًا في استخراج وتمييز نواياهم من خلال قياس 
مشاعرهم. وكما رأينا سابقًا في هذا الفصلء فإن الأدوات التحليلية النصية يمكنها تصنيف المحتوى 
عبر الإنترنت» وكشف المفاهيم ال مرتبطةء وكشف الشعور في محادثة ك ales!"‏ ”سلبي"» أو 
”محايد“ استنادًا إلى الكلمات التي يستخدمها الناس. ومن الناحية AJEL‏ فإنك سوف ترغب في 
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أن تكون قادرًا على تمييز المشاعر تجاه منتج معينء وخدمة معينةء ووحدة أعمال محددة. وكلما 
زادت دقة فهمك للهجة والإدراك الذي يعبر عنه الناس» أصبحت المعلومات أكثر قابلية للتنفيذ, 
لأنك تخفف من المخاوف بش أن التناقض المختلط. ولا يجب وضع علامة ”محايدة“ على العبارة 
ذات التناقض المختلطء مثل: ”فندق في موقع رائع ولكن الحمام ذو رائحة كريهة“ لأن لديك 
إيجابيات وسلبيات LE‏ بعضها البعض. ولكي تكون قابلة للتطبيق» فإنه يجب التعامل مع هذه 
الأنواع من العبارات بشكل منفصل. فمثلاء عندما نقول: ”كان الحمام كريه الرائحة“ هو شيء 
يمكن لأي شخص أن يلمسه بنفسه ويحسن حالته. كما يمكن تقسيم هذه المشاعر وتصنيفهاء 
وإلقاء نظرة على الاتجاهات بمرور الوقت» ورؤية اختلافات كبيرة في الطريقة التي يتحدث بها 
الناس بشكل leu]‏ أو سلبي Xa elie‏ عن مقارنة ا مشاعر حول علامتك التجارية مع منافسيك. 

تحسين دقة النص بشكل مستمر: إن استخدام حزمة تحليل نصوص خاصة Jine‏ الصناعة سوف 
يؤدي إلى معرفة مفردات عملك بالفعل. وسيكون للنظام قواعد لغوية مبنية فيهء لكنه يتعلم مع مرور 
الوقت guasg‏ أفضل وأفضل. وبقدر تمكنك من ضبط نموذج ajla]‏ بقدر حصولك على ال مزيد من 
البيانات» أو معلمات شبكة أفضلء أو تقنيات جديدة لتقديم نتائج أفضلء فإنك ستفعل الشيء نفسه 
مع معالجة اللغات الطبيعية التي تدخل في تحليل ا مشاعر. فإذا قمت بإعداد القواعد. والتصنيفات» 
بالإضافة إلى التنظيم» ومعانى الكلمات» شاهد كيف تبدو النتائج ثم E‏ وكررها مرة أخرى. 


النظر إلى تأثير تأرجح النتائج: يسعى الجميع للوصول إلى نتيجة رائعة على موقع رفيع المستوى» 
ولكن هذا ليس كل شيء فهناك فرق بين النتيجة الرائعة التي تظهر وتختفي في مقابل نتيجة رائعة يتم 
التغريد dg;‏ وإعادة التغريد. والتقاطها من قبل المدونين المؤثرين. ويجب أن توضح لك التحليلات أي 
من الأنشطة المتعلقة بوسائل التواصل الاجتماعي تتحول إلى ”فيروسية“ وأي منها يسكن سريعًاء ولماذا. 
النظر إلى ما وراء العلامة التجارية: إن اهتمام الأشخاص بعلامتهم التجارية فقط يعد من أكبر الأخطاء 
التي يرتكبونها. وللنجاح في تحليل واستخدام وسائل التواصل الاجتماعي» فيجب عليك تفهم كل ما يثار 
من القضايا ا محيطة بمنتجك أو خدمتك. وعادةً لا يهتم العملاء برسالة الشركة أو علامتها التجارية؛ فهم 
يهتمون بأنفسهم. لذلك؛ فإنه يجب الانتباه إلى ما يتحدثون «tie‏ وأين يتحدثون Wi‏ ومع من. 

التعرف على معظم التأثيرات القوية: تعاني المؤسسات من صعوبة تحديد صاحب التأثير الأكبر 
على الرأي elol‏ وهذا يبين أن eal‏ المؤثرين ليسوا بالضرورة ممن يؤيدون علامتك التجارية على وجه 
التحديد؛ ولكنهم يكونون ضمن من يؤثرون على نطاق المحادثة الدائرة حول موضوعكء وينبغي تفهم 
ما إذا كانوا يعطون dalo) t]‏ أو يعبرون عن دعمهم» أو ببساطة يقدمون ملاحظات أو نقد. وذلك 
من خلال فهم طبيعة محادثاتهم» ومكان علامتي التجارية فيما يتعلق با منافسة في تلك المنطقة. 
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النظرة الثاقبة إلى دقة أدواتك التحليلية: حتى وقت قريب ل تكن الأدوات الآلية المعتمدة 
على الحاسب تتسم بدرجة الدقة التي يتمتع بها البشر في غربلة محتوى الإنترنت. وحتى الآن 
تختلف الدقة باختلاف الوسائل. فبالنسبة مواقع مراجعة المنتجات ومواقع مراجعة الفنادق 
وتويتر. يمكن أن تصل إلى دقة تتراوح بين XA‏ و٠5‏ وذلك نظرًا لأن السياق يكون محاصرًا بشكل 
أكبر. وعندما تبدأ بالنظر إلى المدونات ومنتديات المناقشة. حيث تكون المحادثة واسعة النطاقء 
يمكن للبرنامج أن يحقق دقة تصل إلى (Paine & Chaves, 2012) Z1-‏ وستزداد هذه الأرقام 
بمرور الوقت لأن أدوات التحليلات يتم ترقيتها باستمرار بقواعد جديدة وخوارزميات محسنة 
لتعكس التجربة الميدانية وا منتجات الجديدة وتغير ظروف السوق وأنماط الكلام الناشئة. 

دمج ذكاء وسائل التواصل الاجتماعي في التخطيط: جرد أن يكون لديك منظور كبير للصورة 
مع نظرة تفصيلية» يكون بإمكانك البدء في دمج هذه المعلومات في دورة التخطيط الخاصة بك. 
غير أن هذا كلام يصعب تنفيذه. وقد كشف استطلاع سريع للجمهور أن قليل من الناس الآن 
يقومون بدمج التعلم من المحادثات عبر الإنترنت في دورات التخطيط الخاصة بهم )& Paine‏ 
(Chaves, 2012‏ وتعد إحدى طرق تحقيق ذلك هي إيجاد علاقات زمنية بين مقاييس وسائل 
التواصل الاجتماعي وأنشطة الأعمال الأخرى أو أحداث السوق. وعادةٌ ما يتم اللجوء إلى وسائل 
التواصل الاجتماعي إما بشكل أساسي أو بواسطة شيء تقوم به مؤسستك. وبالتاليء إذا لاحظت 
تصاعدًا في النشاط في أي نقطة من الزمن» فتكون بحاجة لمعرفة أسباب ذلك. 


أسئلة مراجعة على القسم :٠١-0‏ 

-١‏ ما المقصود بالتحليلات الاجتماعية؟ وطاذا تعتبر مهمة؟ 

-Y‏ ما هي الشبكة الاجتماعية؟ وما هي الحاجة لنظام الحسابات القومية؟ 

*- ما هي وسائل التواصل الاجتماعي؟ وكيف ترتبط ب 2.0 $Web‏ 

-E‏ ما هي تحليلات وسائل التواصل الاجتماعي؟ وما هي أسباب تزايد انتشارها؟ 
0- كيف كنك قياس تأثير تحليلات وسائل التواصل الاجتماعي؟ 


تلخيص لأهم نقاط الفصل: 

- التنقيب في النص هو اكتشاف المعرفة من مصادر البيانات غير المهيكلة GE)‏ تستند إلى النص). 
وحيث إن قدرًا DS‏ من المعلومات يكون في شكل «a‏ فإن التنقيب في النص هو واحد من 
أسرع فروع مجال ذكاء الأعمال نموًا. 
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- تتواجد تطبيقات التنقيب في النص في كل مجال من مجالات العمل والحكومة تقريبًاء ها في ذلك 
التسويق والتمويل والرعاية الصحية والطب والأمن الداخلي. | 

- يقوم التنقيب في النص باستخدام معالجة اللغة الطبيعية (NLP)‏ للحث على هيكلة مجموعة 
gogail‏ ثم يستخدم بعد ذلك خوارزميات التنقيب في البيانات مثل التصنيف والتجميع 
والاقتران وتسلسل الاكتشاف لاستخراج المعرفة منها. 

- يمكن تعريف الشعور بأنه رأي Cab‏ يعكس مشاعر المرء. 

- يتعامل تحليل المشاعر مع التمييز بين فئتين؛ إيجابية وسلبية. 

- كمجال للبحث» يرتبط تحليل المشاعر ارتباطًا وثيقًا بعلم لغات الحاسوب والبرمجة اللغوية 
العصبيةء والتنقيب في النصوص. 

- يحاول تحليل المشاعر الإجابة عن السؤال التالي: ”بم يشعر الناس حول موضوع معين؟“ عن 
طريق التعمق في آراء الكثيرين باستخدام مجموعة متنوعة من الأدوات الآلية. 

- يعتبر صوت العميل (VOC)‏ جزءًا لا يتجزأ من alb‏ إدارة علاقات العملاء التحليلية وإدارة 
تجارب العملاءء وغالبًا ما يتم تشغيلها من خلال تحليل المشاعر. 

- يدور صوت السوق (VOM)‏ حول فهم الآراء والاتجاهات الكلية على مستوى السوق. 

- يتم تحقيق تحديد التناقض في تحليل المشاعر إما باستخدام المعجم كمكتبة مرجعية أو باستخدام 
مجموعة من وثائق التدريب. 

WordNet -‏ هو معجم شهير للأغراض العامة تم إنشاؤه في جامعة برينستون. 

Senti WordNet -‏ هو امتداد ل WordNet‏ لكي يُستخدم لتعريف المشاعر. 

- تحليلات الكلام هي مجال متزايد من العلوم يسمح للمستخدمين بتحليل واستخراج ال معلومات 
من المحادثات الحيّة والمُسجلة. 

- يمكن تعريف التنقيب في الويب بأنه اكتشاف وتحليل معلومات مثيرة للاهتمام ومفيدة من 
الويب» وعن الويب» foleg‏ ما تستخدم أدوات تستند إلى الويب. 

- يمكن النظر إلى التنقيب على الويب على أنه يتكون من ثلاثة مجالات هي: التنقيب في محتوى 
الويب» والتنقيب في هيكل الويب» والتنقيب في استخدام الويب. l ٠‏ 

- يشير التنقيب في محتوى الويب إلى الاستخراج التلقائي للمعلومات المفيدة من صفحات الويب» 
ويمكن استخدامه لتحسين نتائج البحث التي تنتجها محركات البحث. 
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- يشير التنقيب في هيكل الويب إلى توليد معلومات مثيرة للاهتمام من الروابط الموجودة ضمن 


- يمكن استخدام التنقيب في هيكل الويب LóÍ‏ لتحديد أعضاء مجتمع معينء ورا أيضًا لأدوار 
الأعضاء في ا مجتمع. 


- يشير تعدين استخدام الويب إلى تطوير معلومات مفيدة من خلال تحليل سجلات خادم الويب» 
وملفات تعريف المستخدمينء» ومعلومات المعاملات. 

- ظهر كل من التنقيب في النصوص والتنقيب في الويب كمكونات حيوية للجيل القادم من أدوات 
ذكاء الأعمال لتمكين المنظمات من التنافس بنجاح. 

- محرك البحث هو برنامج يقوم بالبحث عن الوثائق (مواقع الإنترنت أو (OL‏ استنادًا إلى 
الكلمات المفتاحية (كلمات فردية» أو مصطلحات متعددة الكلمات. أو جملة كاملة) التي 
يقدمها المستخدمونء والتي تتعلق بموضوع استعلاماتهم. 

SEO -‏ هو النشاط ا معني بالتأثير على رؤية أي موقع تجارة إلكترونية أو أي موقع ويب في نتائج 
البحث الطبيعية ملحرك البحث (غير المدفوع أو الأساسي). 

VOC -‏ هو مصطلح يستخدم bole‏ لوصف العملية التحليلية لالتقاط توقعات العميل وتفضيلاته 


وعدم تفضيلاته. 
- التحليلات الاجتماعية هي مراقبة وتحليل وتفسير التفاعلات الرقمية وعلاقات الأشخاص 
والمواضيع والأفكار واملحتوى. 


- الشبكة الاجتماعية هي بنية اجتماعية تتألف من أفراد / أشخاص (أو مجموعات من الأفراد أو 
المنظمات) ترتبط فيما بينها بنوع من الروابط / العلاقات. 

- تشير تحليلات وسائل التواصل الاجتماعي إلى الطرق المنهجية والعلمية لاستهلاك الكمية الهائلة 
من ال محتوى الذي تم إنشاؤه بواسطة منافذ وأدوات وتقنيات وسائل التواصل الاجتماعي على 
الويب من أجل تحسين القدرة التنافسية للمنظمات. 








مصطلحات أساسية: 
اقتران. معالجة اللغة الطبيعية تحليلات وسائل التواصل البيانات غير 
.(NLP)‏ الاجتماعي. المهيكلة. 
صفحات | وضع علامات على جزء من شبكة اجتماعية. صوت العميل 
موثوقة. (VOC) EY‏ 
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تحليلات الويب. 


عنكبوت. 


تحديد التناقض. 

















الويب. 


تحليل النقر. -Polyseme‏ الانبثاق. التنقيب في محتوى 
الويب 
تجمع محرك البحث. كلمات التوقف. زاحف الويب. 
جسم. تحليل المشاعر. مصفوفة التنقيب في الويب. 
Term-Document‏ 
.(TDM)‏ 
كشف الخداع. -SentiWordNet‏ التنقيب في النص. التنقيب à‏ بنية 
الويب. 
المحاور. تحليل القيمة ال مفردة "Tokenizing (SVD)‏ التنقيب باستخدام ١‏ 





-WordNet 








تحليل النزعة. 








البحث عن 
موضوع ناجم 
رابط تشعبي 

(HITS) 








أسئلة للمناقشة: 

-١‏ اشرح العلاقة بين التنقيب في البيانات» والتنقيب في النص» وتحليل المشاعر. 

-Y‏ عرف - بأسلوبك الخاص - التنقيب في oal‏ وناقش تطبيقاته الأكثر شيوعًا. 

-Y‏ ماذا يعني الحث على هيكلة البيانات النصية؟ ناقش الطرق البديلة لهيكلة البيانات النصية. 

-E‏ ما هو دور NLP‏ في التنقيب في النص؟ ناقش قدرات وقيود NLP‏ في سياق التنقيب في النص. 

0- اسرد وناقش ثلاثة مجالات تطبيق بارزة للتنقيب في النص. ما هي الفكرة الرئيسة الشائعة بين 
مجالات التطبيق الثلاثة التي اخترتها؟ 

1- ما هو تحليل المشاعر؟ وكيف يرتبط بالتنقيب في النص؟ 


-V‏ ما هي التحديات الشائعة التي يتعين على تحليل المشاعر التعامل معها؟ 


-A‏ ما هي مجالات التطبيق الأكثر شيوعًا لتحليل المشاعر؟ وماذا؟ 
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4- ما هي الخطوات الرئيسة في تنفيذ مشروعات تحليل المشاعر؟ 

-V+‏ ما هما الطريقتان الشائعتان لتحديد التناقض؟ اشرح إجابتك. 

-١‏ ناقش أوجه الاختلاف والشبه بين التنقيب في النص والتنقيب في الويب. 

-١١‏ بأسلوبك الخاص عرف التنقيب في الويب» مع مناقشة أهميته. 

MW‏ ما هي المجالات الرئيسة الثلاثة للتنقيب في الويب؟ ناقش أوجه الاختلاف والشبه بين هذه 
المجالات الثلاثة. 

-٤‏ ما هو محرك البحث؟ leg‏ يعتبر مهما للشركات؟ 

5- ما هو ISEO‏ ومن الذي يستفيد Tdio‏ وكيف؟ 

7- ما هي تحليلات الويب؟ وما هي المقاييس المستخدمة فيها؟ 

۷- عرف كلا من التحليلات الاجتماعية والشبكة الاجتماعية وتحليلات الشبكة الاجتماعية. وما 
هي العلاقات فيما بينها؟ 

-VA‏ ما هي تحليلات وسائل التواصل الاجتماعي؟ وكيف تتم؟ ومن الذي يقوم بها؟ وماذا يخرج منها؟ 


تمارين - شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 

-١‏ قم بزيارة .teradatauniversitynetwork.com‏ حدد الحالات عن التنقيب في النص. قم 
بوصف التطورات الأخيرة في هذا المجال. إذا لم تستطع إيجاد حالات كافية على موقع شبكة 
جامعة labs‏ على الوبب» قم بتوسيع بحثك إلى موارد أخرى تستند إلى الويب. 

-Y‏ انتقل إلى teradatauniversitynetwork.com‏ أو حدد مكان الأوراق البيضاء والندوات على 
الويب واللواد الأخرى المتعلقة بالتنقيب في النصوص. قم بتجميع النتائج الخاصة بك في 
تقرير قصير مكتوب. 

؟- اذهب إلى teradatauniversitynetwork.com‏ وقم بإيجاد دراسة الحالة التي تحمل اسم 
“eBay Analytics"‏ اقرأ الحالة بعناية, وافهمها جيدًا من خلال البحث في الإنترنت للحصول 
على معلومات إضافيةء والإجابة عن أسئلة الحالة. 

£- انتقل إلى teradatauniversitynetwork.com‏ وابحث عن حالة تحليل المشاعر التى تحمل 

اسم «iog 1,8! “How Do We Fix an App Like That?"‏ واتبع الإرشادات لتنزيل 
بيانات وأداة تنفيذ التمرين. 
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الفصل الخامس 


0- قم بزيارة -teradatauniversitynetwork.com‏ حدد الحالات عن التنقيب في الويب. قم 
بوصف التطورات الأخيرة في هذا المجال. إذا للم تستطع إيجاد حالات كافية على موقع شبكة 
جامعة تيراداتا على الويب» قم بتوسيع بحثك إلى موارد أخرى تستند إلى الويب. 

1- تصفح الويب وقواعد البيانات الرقمية الخاصة مكتبتك لتحديد المقالات التي تصنع الرابط بين 
التنقيب في النصوص / الويب والأنظمة المعاصرة لذكاء الأعمال. 


مشروعات مهام الفريق ولعب الأدوار: 

-١‏ افحص كيقية التقاط البيانات النصية تلقائيًا باستخدام تقنيات الويب. وفور التقاطهاء ما هي 
الأنماط المحتملة التي يمكنك استخراجها من هذه المصادر غير المهيكلة للبيانات؟ 

-Y‏ قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في مؤسستك لتحديد كيف يمكن أن 
يساعدهم التنقيب في النصوص والتنقيب في الويب في عملهم. اكتب اقتراحًا يصف نتائجك» 
ثم Al‏ تقريرًا يتضمن تقديرات التكلفة والفوائد. 

"- انتقل إلى موارد مكتبتك على الإنترنت. تعلم كيفية تنزيل سمات مجموعة من الأدبيات 
(مقالات الدوريات) في موضوع محدد. ثم قم بتنزيل البيانات ومعالجتها باستخدام منهجية 
مشابهة لتلك التي تم شرحها في الحالة العملية )6-0( 

-٤‏ ابحث عن مجموعة بيانات نص المشاعر do Ll‏ بسهولة (انظر الرؤية الفنية (0-؟)للحصول على 
قائمة بمجموعات البيانات الشائعة) وقم بتنزيلها إلى جهاز الحاسب الخاص بك. إن كان لديك 
أداة تحليلية قادرة على التنقيب في النصوص» فاس تخدمها. وإن لم يكن قم بتنزيل وتثبيت 
-RapidMiner (http://rapid-i.com)‏ قم Lá‏ بتثبيت الوظيفة الإضافية Text Analytics‏ 
لبرنامج -RapidMiner‏ قم بمعالجة البيانات التي تم تنزيلها باستخدام أداة التنقيب في النص 
(أي تحويل البيانات إلى نموذج منظم)» ثم قم ببناء النماذج وتقييم دقة الكشف عن المشاعر 
في العديد من نماذج التصنيف (مثل: آلة المتجهات الداعمة. أشجار القرارء الشبكات العصبية 
الانحدار اللوجستي). اكتب تقريرًا تفصيليًا تشرح فيه نتائجك وخبراتك. 

0- افحص كيفية التقاط البيانات المستندة إلى الويب تلقائيًا باستخدام أحدث التقنيات. وفور 

التقاطهاء ما هي الأنماط المحتملة التي يمكنك استخراجها من هذه المصادر الغنية بالمحتوى 
للبيانات» والتي تكون في معظمها غير منظمة؟ 
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التحليلات التنبؤية (۲): تحليلات النص والويب ووسائل التواصل الاجتماعي 


تمارين الإنترنت: 

-١‏ قم بإيجاد حالات حديثة لتطبيقات ناجحة عن التنقيب في النصوص والتنقيب في الويب. 
جرب موردي وشركات الاستشارات لبرامج التنقيب في النصوص والويب وابحث عن حالات أو 
قصص نجاح» ثم قم بإعداد تقرير يلخص خمس دراسات حالة جديدة. 

-Y‏ انتقل إلى .statsoft.com‏ اختر Downloads‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل 
حول التطبيقات. أي من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / 
الويب التي تمت مناقشتها في هذا الفصل؟ 

-Y‏ انتقل إلى «sas.com‏ وقم بتنزيل ثلاث صفحات clay‏ على الأقل حول التطبيقات. أي من 
هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشنها 
في هذا الفصل؟ 

-é‏ انتقل إلى ibm.com‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 

0- انتقل إلى deradata.com‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي 
من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 

- انتقل إلى «larabridge.com‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. 
أي من هذه التطبيقات استخدم تقنيات التنقيب في النص بطريقة مبتكرة؟ 

-V‏ انتقل إلى Kdnuggets.com‏ قم باستكشاف الأقسام حول التطبيقات وكذلك البرامج. قم 
بإيجاد أسماء ثلاث حزم إضافية على الأقل للتنقيب في البيانات والتنقيب في النصوص. 

8- قم بمسح بعض أدوات وموردي التنقيب في الويب. حدد بعض منتجات التنقيب في الويب 
ومقدمي الخدمات غير المذكورة في هذا الفصل. 

3- انتقل إلى attensity.com‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي 
من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 
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الفصل السادس 
التحليلات التوجيهية: التحسين والمحاكاة 


أهداف التعلم: 
- فهم تطبيقات تقنيات التحليلات التوجيهية بالاشتراك مع إعداد التقارير والتحليلات التنبؤية. 
- استيعاب المفاهيم الأساسية لنمذجة القرارات التحليلية. 
- استيعاب مفاهيم النماذج التحليلية لمشاكل القرار ا مختارة Le‏ في ذلك البرمجة الخطية ونماذج 
المحاكاة لدعم القرار. 
- وصف كيفية استخدام جداول البيانات بالنسبة لكل من النمذجة التحليلية والحلول التحليلية. 
- شرح المفاهيم الأساسية للتحسين وتوقيت استخدامها. 
- وصف كيفية هيكلة موذج برمجة خطية. 
- شرح المقصود بتحليل الحساسيةء وتحليل «ماذا - g)‏ والبحث عن الهدف. 
- استيعاب مفاهيم وتطبيقات أنواع المحاكاة المختلفة. 
- فهم التطبيقات المحتملة لممحاكاة الأحداث منفصلة. 
يعد هذا الفصل إضافة جديدة إلى هذا الكتاب» حيث يتخطى مرحلة تطبيقات التحليلات وصولا 
إلى ما بعد إعداد التقارير والتحليلات التنبؤية. ويغطي هذا الفصل التقنيات المختارة التي هكن 
توظيفها جنبًا إلى جنب مع النماذج التنبؤية للمساعدة في دعم القرار. ونركز هنا على التقنيات 
التي يسهل تنفيذها Gurs‏ سواء باستخدام أدوات جداول البيانات أو باستخدام أدوات برمجية AB‏ 
بذاتها. وبالطبع» يوجد الكثير من التفاصيل الإضافية ليتم تعلمها حول نماذج علوم SYI‏ ولكن 
الهدف من هذا الفصل هو فقط توضيح ما هو ممكن وكيفية تنفيذه ضمن إعدادات حقيقية. 
ونعرض فيما يلي تقديًا لهذه المادة مع ملاحظة الحذر: قد تشكل النمذجة موضوعًا صعبًاء 
كما تعد ÉS‏ بجانب كونها -Kle‏ وليس بالضرورة أن تكون الغاية من هذا الفصل أن تصبح خبيا 
با موضوعات التي تتعلق بالنمذجة والتحليل» ولكن تُستخدّم Ball‏ لاكتساب المعرفة بالمفاهيم 
المهمة من حيث صلتها بالتحليلات التوجيهية واستخدامها في صنع القرار. ومن امهم أن ندرك أن 
النمذجة التي نحن بصدد الحديث عنها هنا ترتبط فقط بشكل سريع بممفاهيم نمذجة OLLI‏ 
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فيجب عدم الخلط بينهما. إننا نتحرك عبر بعض الطفاهيم والتعاريف الرئيسة لنمذجة القرارء ونقدم 
بعد ذلك فكرة النمذجة بشكل مباشر في جداول البيانات» ثم بعد ذلك نناقش الهيكل والتطبيق 
لنماذج ومنهجيات برهنت على نجاحها عبر الزمن: البرمجة الخطية ومحاكاة الحدث المنفصل. 
وكما 555 Ls‏ من الممكن الحصول على دورات متعددة - تحديدًا - في هذين الموضوعينء ولكن 
هدفنا هو منحك إحساس Ue‏ هو ممكنء وذلك من خلال الأقسام المتنوعة لهذا الفصل. 


1-1 مقال افتتاحي: منطقة فيلاديلفيا التعليمية تستخدم التحليلات التوجيهية 
لإيجاد J>‏ أمثل لإبرام عقود خطوط سير الحافلات: 
خلفية: 


يعد اختيار أفضل الموردين للعمل مهمة مرهقة بل وذات أهمية كبيرة للشركات والمنظمات 
الحكومية. فبعد تقديم كل مورد لعطائه بخصوص مهمة معينة من خلال عملية المناقصة تقوم 
الشركة أو ال منظمة بتقييم كل اقتراح ومن ثم اتخاذ قرار بشأن اختيار المورد الأنسب لاحتياجاتهم. 
aleg‏ تضطر الحكومات لاستخدام عملية تقديم العطاءات للمفاضلة بين الموردين ومن ثم 
الاختيار من بينهم. كانت منطقة فيلاديلفيا التعليمية تسعى للاستعانة مصادر خارجية لبعض 
خطوط الحافلات الخاصة بهم؛ إذ لا تمتلك المقاطعة إلا عددًا قليلًا من حافلات المدارس, لا يكفي 
لخدمة الطلاب القاطنين بهاء فكانوا يخدمون بحافلاتهم الخاصة من <۲١‏ إلى ٤١‏ فقط من 
الطرق» فقرروا الاستعانة بموردي خدمة الحافلات الخاصة كمصدر خارجي لتغطية بقية الطرق. 
تم تكليف تشارلز لويتز (Charles Lowitz)‏ المنسق UI‏ لمكتب النقل» بتحديد LAS‏ تعظيم 
العائد على الاستثمار وتحسين طريقة إبرام العقود مع مختلف الموردين. 

في الماضيء كانت عملية اختيار موردي خدمة الحافلات الذين يتم التعاقد معهم وفقًا للقيود 
المالية والزمنية عملية مرهقة إذ كانت تتم يدويًا. بالإضافة إلى ذلك كانت المتغيرات والعوامل 
ا مختلفة التي يجب مراعاتها تزيد الأمر تعقيدًا. فقد كانت عملية تقييم الموردين لهذه الخدمة 
تتم fU‏ على خمسة متغيرات وهي: التكلفةء والقدرات» والأمانة والاستقرار «JUI‏ والفراسة. 
قام JS‏ مورد بتقديم عطاءه بسعر مختلف للطرق المختلفة. وضع بعض الموردين حدًا أدنى 
sus)‏ خطوط (JI‏ وفي ilo‏ عدم مقابلة هذا العدد للمطلوب» فستزيد التكلفة. وكان Lowitz‏ 
بحاجة 5s‏ كيفية دمج المعلومات لكل عطاء تم تقدهه» وذلك لتوزيع خطوط السير على 
الموردين بحيث تتم تغطية كل الطرق بأقل تكلفة. 
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الحل: 

بحث Lowitz‏ في البداية عن برنامج يستطيع استخدامه جنبًا إلى جنب مع نموذج العقد 
الخاص به على Excel‏ فہداً باستخدام برنامج Premium Solver‏ من شركة Frontline‏ 
Systems‏ مما مكنه من تحديد أفضل الموردين ماليًا وتشغيليًاء els‏ بإنشاء نموذج أمثل يأخذ 
في الحسبان المتغيرات الخمسة سالفة الذكر المتعلقة بكل مورد. وقد تضمن النموذج متغيرات 
ثنائية صحيحة (نعم / (Y‏ لكل خط من خطوط السير ليتم منحها للموردين الذين تقدموا لتغطية 
خط سير معين بتكلفة معينة. وقد بلغت هذه المتغيرات OR‏ (نعم / (Y‏ ما يقرب من 17٠١‏ 
متغير. كما تضمن النموذج أيضًا قيودًا تشير إلى أنه سيتم تخصيص مورد واحد فقط لكل خط 
سير وبالطبع لا بد من تغطية كل خطوط السير. وتم وضع حد dal‏ لعدد خطوط السير التي 
يخدمها أي ijs a‏ كما تم وضع قيود لبعض التفاصيل الأخرى. ويمكن كتابة كل هذه القيود 
كمعادلات وإدخالها في نموذج برمجة خطية تامة. وتجدر الإشارة إلى أن هناك العديد من أدوات 
البرامج تستطيع صياغة مثل هذه النماذج وحلهاء غير أن استخدام Microsoft Excel‏ يجعل فهم 
النموذج أمرًا أكثر سهولة. فتم تضمين برنامج Solver‏ الخاص بشركة Frontline Systems‏ داخل 
أدوات Microsoft Excel‏ للقيام بحل المشاكل الصغيرة مجانًا. أما النماذج الأكبر حجمًا والأكثر 
تعقيدًا فيمكن حلها عن طريق شراء إصدار أكبر. liag‏ ما فعله -Lowitz‏ 


الفوائد: 

ساعد النموذج في تطوير حجم كل عقد من العقود, فضلًا عن تحديد عدد الموردين الواجب 
التعاقد معهم. حيث يتفاوت حجم العقود من مورد لآخر وذلك ما بين ٩۷-٤‏ خط سير للمورد 
الواحد. وف النهاية. تمكنت منطقة فيلاديلفيا التعليمية من وضع خطة تحتوي على العدد الأمثل 
لشركات توريد الحافلات باستخدام برنامج as Excel‏ من العملية اليدوية. وهكذا تمكنت 
المقاطعة من توفير الوقت وامال وذلك باستخدام الأدوات التحليلية لبرنامج Premium Solver‏ 
لإنشاء نموذج أمثل بالمتغيرات المختلفة. 


ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 
تواجه معظم المنظمات مشكلة صنع القرارات حين يلزم اختيار واحد من Bae‏ خيارات. إذ 


يكون لكل خيار تكلفة وإمكانية يرتبطان به. وتهدف مثل هذه النماذج إلى اختيار توليفة من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ory‏ 


الفصل السادس 


التحليلات التوجيهية بشكل خاص على مثل هذه المشكلة المتعلقة بالقرارات. ووجود أدوات مثل 
Premium Solver‏ المتاح داخل Excel‏ يجعل من السهولة بمكان تطبيق مثل هذه التقنيات. 


أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ ما هو القرار المتخذ في هذه اطقالة الإفتتاحية؟ 
-Y‏ ما هي البيانات (الوصفية أو التنبؤية) التي قد يتم الاحتياج إليها لعمل أفضل التوزيعات في هذا السيناريو؟ 
galt‏ التكاليف أو القيود الأخرى الواجب مراعاتها عند إبرام مثل هذه العقود المتعلقة بخطوط السير؟ 
-E‏ ما هي المواقف الأخرى التي يمكن تطبيق مثل هذه النماذج عليها؟ 
۲-٣‏ اتخاذ القرار flu‏ على النموذج: 

إن اتخاذ القرارات باستخدام أحد أنواع النموذج التحليلي هو ما نسميه التحليلات التوجيهية, 
وذلك كما تبين من JULI‏ القصيرة السابقة. وقد تعلمنا في العديد من الفصول السابقة قيمة 
وعملية معرفة تاريخ ما يجري واستخدام هذه المعلومات أيضًا من أجل التنبؤ بالأمور المرجح 
حدوثها. deg‏ أية حال فإننا سنحاول من خلال هذا التمرين تحديد ما ينبغي dlas‏ فيما هو 
cl‏ وقد يترتب على ذلك تحديد العملاء er PL‏ قيامهم بالشراء منا وتقديم عرض أو إعطاء 
سعر يزيد من احتمالية قيامهم بالشراء وبالتالي فإن ذلك سيؤدي إلى تعظيم الأرباح إلى الحد 
الأمشل. وعلى العكس من «US‏ فقد ينطوي الأمر على القدرة على التنبؤ بالعميل الذي يحتمل 
اتجاهه إلى مكان آخر والقيام بتقديم عرض مُغري له للاحتفاظ به كأحد العملاء ورفع قيمتنا 
لديه. وللتأكد من تغطية جميع احتياجاتنا وتقليل التكلفة إلى أدنى حد ممكن فإننا قد نحتاج إلى 
اتخاذ بعض القرارات بخصوص منح العقود للموردين. ومن Kabl‏ أن نواجه وضعًا ما يتطلب 
تحديد أي العملاء المحتملين ينبغي حصوله على مواد الحملة الترويجية بحيث لا تكون تكاليف 
الترويج التي نتحملها باهظة» ونقوم بزيادة معدل الاستجابة إلى أقصى حد ممكن با لا يتعدى 
حدود الميزانية. وقد نتخذ قرارًا بشأن ما يجب دفعه مقابل كلمات البحث الرئيسة غير الجانية 
لرفع عائد الاستثمار مميزانية الإعلانات الخاصة بنا إلى أقصى حد ممكن. وعلى صعيد آخرء فإننا قد 
نضطر إلى دراسة تاريخ أنماط وصول عملائنا واستخدام تلك المعلومات من أجل Sal‏ معدلات 
الوصول المستقبليةء وتطبيق ذلك لجدولة عدد مناسب من موظفي المتجر لرفع استجابات العملاء 
إلى أقصى حد بالإضافة إلى تحسين تكاليف العمالة لدينا. ويمكننا من خلال الاعتماد على تحليلاتنا 


Source: Adapted with permission from "Optimizing Vendor Contract Awards Gets an A+,” http:// www. 
solver.com/news/optimizing-vendor-contract-awards-gets, 2016 (accessed July 2016). 
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وتوقعاتنا للطلب على منتجاتنا وتكاليف سلس لة a sl‏ اتخاذ قرارات بشأن المواقع التي سنقوم 
فيها بإنشاء مستودعاتنا. بالإضافة إلى أن المعلومات الخاصة بأحجام المنتجات التي سيتم تسليمها 
في مواقع مختلفة وتكاليف التسليم وتوافر سيارة للنقل تسمح لنا بتحديد طرق التسليم اليومية. 
ويستطيع الشخص الحصول على مئات الأمثلة الخاصة بالحالات التي تكون فيها القرارات المستندة 
إلى البيانات ذات قيمة. وف الواقع» فإن القدرة على استخدام رؤى وصفية وتنبؤية لمساعدة 
صانع القرار على اتخاذ قرارات أفضل تعد أكبر فرصة متاحة dil‏ التحليلات المتنامية. وعلى 
الرغم من وجود حالات يتم اتخاذ القرارات فيها من خلال الاعتماد على الخبرة والحدس» غير 
أن الأرجح أن القرارات التي يدعمها نموذج ما ستساعد صانع القرار على اتخاذ قرارات أفضل. 
وبالإضافة إلى ذلك adl‏ فإن هذه القرارات التي يدعمها نموذج ما ستوفر لصانعي القرار مبررات 
للتوصيات التي يقدمونها. وهكذا برزت التحليلات التوجيهية باعتبارها أقصى ما انتهى إليه العلم 
في مجال التحليلات ليتم تطبيقه dio‏ وهي تنطوي بشكل أساسي على استخدام نموذج تحليلي 
للمساعدة في توجيه gilo‏ القرار في اتخاذ القرارء أو جعل عملية اتخاذ القرار عملية آلية وذلك 
حتى يتمكن النموذج من تقديم توصيات أو قرارات. ونظرًا لأن التحليلات التوجيهية تركز على 
تقديم التوصيات أو اتخاذ القرارات» فإن البعض يسمي هذه الفئة من التحليلات بتحليلات القرار. 
وتتضمن جميع منشورات INFORMS‏ مثل ORMS TODAY 9 Interfaces‏ ومجلة التحليلات 
Analytics‏ القصص التي توضح التطبيقات الناجحة لنماذج القرار في الإعدادات الحقيقية. 
ويشتمل هذا الفصل على العديد من الأمثلة على مثل هذه التطبيقات التحليلية الإرشادية. وتجدر 
بنا الإشارة إلى أن تطبيق نماذج لحالات واقعية مكنها أن توفر ملايين الدولارات أو تدر عائدًا ملايين 
الدولارات. وقد وصف كل من Christiansen‏ وآخرون )3 (Y‏ تطبيقات هذه النماذج في عمليات 
شركة الشحن باستخدام TurboRouter‏ بأنها نظام دعم القرار (DSS)‏ لتوجيه السفن والجدولة 
وهم يدعون أن الشركة استخدمت هذا النموذج على مدى ثلاثة أسابيع لتحسين الاستفادة من 
أسطولهاء الأمر الذي أدى إلى تحقيق ربح إضافي يتراوح من مليون إلى مليوني دولار في Jia‏ هذه 
الفترة الزمنية القصيرة. وفي الحالة العملية (V7‏ نقدم مثالا آخر لتطبيق نموذج. 
حالة عملية ١-5‏ 
النقل الأمثل للبيانات من الخادم Downstream‏ لشركة إكسون موبيل ExxonMobil‏ 
من خلال نظام دعم القرار DSS‏ 
شركة إكسون موبيل هي شركة Jojo‏ وغاز طبيعيء وتعمل في العديد من البلدان 
في جميع أنحاء العام وتوفر الشركة المنتجات البترولية ا مختلفة. ها في ذلك الوقود 
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النظيف» ومواد التشحيم. والمنتجات ذات القيمة العالية بالإضافة إلى المواد الخام 
للعديد من العملاء. ويتم استكمال ذلك من خلال سلسلة توريد معقدة بين مصافيها 
وعملائها. ويّعد زيت غاز التفريخ vacuum (VGO)‏ هو أحد المنتجات الرئيسة لشركة 
ExxonMobil‏ الناقلة transports‏ وتقوم شركة إكسون ExxonMobil Juss‏ بنقل 
العديد من السفن EET‏ بشحنات shiploads‏ زيت غاز التفريغ VGO‏ من أورويا إلى 
الولايات المتحدة. وتشير التقديرات إلى أن إكسون موبيل تقوم بنقل حوالي من Vete‏ 
سفينة محملة بزيت غاز التفريغ VGO‏ عبر المحيط الأطلسي؛ في العام الواحد. وقد كان 
من المقرر حتى OVI‏ أن تتم عملية نقل زيت غاز التفريغ VGO‏ عبر المحيط الأطلسي 
من خلال عملية نقل يدوية مرهقة سواء تم هذا النقل من خلال السغن التي تديرها 
شركة إكسون موبيل أو سفن طرف ثالث third-party‏ على حد سواء. وتتطلب العملية 
برمتها تعاون العديد من الافراد عبر منظمة سلسلة التوريد. ولتحديد الجدول الزمني 
للنقل الخاص بالسفن فإنه يتم استخدام العديد من جداول البيانات المخصصة ذات 
القيود والمتطلبات الخاصة والمقايضات الاقتصادية. وقد شملت بعض القيود ما يلي: 

-١‏ تفاوت توقعات الإنتاج والطلب بصفة دائمة. 

-Y‏ قيود الحد الأدنى والحد الأقصى من المخزون. 

-Y‏ مجموعة من السفن المتنوعة (مثل: السفن ذات السرعات المتفاوتة وحجم البضائع). 

€- السفن التي يتم تنزيلها وتفريغها في منافذ متعددة. 

0- كل من إكسون موبيل DIA‏ ومستلزمات الطرف الثالث والمنافل. 

- تكلفة النقل المعقدة والتي تتضمن تغطية زيادة التكاليف وغرامات التأخير. 

-V‏ حجم السفينة وحدود المسارات للموانئ المختلفة. 

ويتعذر على العملية اليدوية القيام بتحديد المسارات الفعلية للسفنء وتوقيت كل 
سفينة. وكمية زيت غاز التفريغ VGO‏ المحملة أو المفرغة. وبالإضافة إلى ذلك. فإن 
بيانات الإنتاج والاستهلاك في عدة مواقع جعلت العملية اليدوية مرهقة وغير فعالة. 

المنهجية / الحل: 

وقد تم تطوير أداة دعم القرار التي تساعد المُجدولين على التخطيط لجدول زمني 
مثالي للسفن لتنزيل» Jg‏ وتفريغ زيت غاز التفريخ VGO‏ من وإلى Bas‏ مواقع. وقد تم 
صياغة المشكلة كمشكلة البرمجة الخطية العددية. وقد كان من الضروري أن يلبي الحل 
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ا متطلبات الخاصة بالتوجيه. والنقلء والجدولةء وإدارة المخزون إزاء تباينات الإنتاج والطلب 
ا مختلفة. وقد استُخدمّت لغة البرمجة الرياضية GAMS‏ لصياغة ا مشكلة. كما استخدم 
مايكروسوفت إكسل Microsoft Excel‏ كواجهة المستخدم. وعندما يتم تشغيل آلة dodi‏ 
(ILOG CPLEX)‏ فإنه يتم التوصل إلى حل أمثل في نقطة تتوقف فيها القيمة الموضوعية 
للحل الحالي عن التحسن» حيث يتم تحديد معيار التوقف خلال كل برنامج تشغيل. 

النتائج / الفوائد: 

ومن المتوقع أن يؤدي استخدام نموذج التحسين إلى خفض تكاليف الشحن بالإضافة 
إلى خفض النفقات الخاصة بغرامات التأخير. ونظرًا لأن الأداة ستكون قادرة على دعم 
ستخدام السفن بطريقة أفضل كما lil‏ تساعد في اختيار السفن (مثل: Panamax‏ 
(Afamax Jlis‏ وتصميم جداول التوجيه الأمثل فإن ذلك من شأنه تحقيق هدف 
خفض تكاليف الشحن بالإضافة إلى خفض النفقات الخاصة بغرامات التأخير. وينوي 
الباحثون مواصلة البحث عن طريق استكشاف أساليب رياضية أخرى بديلة من أجل 
حل مشكلة الجدولة. كما أنهم يعتزمون أيضًا gua‏ أداة أنظمة دعم القرار القدرةً على 
لنظر في منتجات متعددة لمجموعة من السفن. 

أسئلة للمناقشة: 

-١‏ اذكر ثلاث طرق توضح كيف يكن أن تؤدي الجدولة اليدوية للسفن إلى تحمّل 
لمزيد من التكاليف التشغيلية مقارنةٌ بالأداة التي تم تطويرها. 

-Y‏ كيف هكن لشركة إكسون موبيل الاستفادة بطرق أخرى من أدوات دعم القرار 
التي تم تطويرها من أجل توسيع وتحسين عملياتها التجارية الأخرى؟ 

-Y‏ ما هي بعض القرارات الإستراتيجية التي هكن اتخاذها من قبل صناع القرار 
باستخدام الأداة التي تم تطويرها؟ 
Source: Adapted from Furman, K. C., Song, J. H., Kocis, G. R., McDonald, M. K.,‏ 


& Warrick, P. H. (2011). Feedstock routing in the ExxonMobil downstream sector. 
Interfaces, 41(2), 149163-. 





أمثلة نموذج تحليلات توجيهية: 
تعتمد التحليلات التوجيهية على النمذجة كعنصر أساسي. وف الأمثلة التي ذكرناها ÉT‏ في 
حالات التقديم والتطبيق ينبغي على الفرد استخدام نموذج رياضي حتى يتمكن من التوصية بقرار 
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لأي مشكلة واقعية. فعلى سبيل JEB‏ نجد أن تحديد العميل (من بين ملايين العملاء ا محتملين) 
الذي سوف يتلقى عرضًا بغرض تعظيم قيمة الاستجابة الإجمالية مع التقيد بحدود اميزانية. ليس 
بالأمر الذي يمكنك القيام به يدويًا. وبناء نموذج زيادة الاستجابة إلى الحد الأقصى المستند إلى 
الاحتمالية مع التقيد بحدود الميزانية. من شأنه أن يوفر UJ‏ المعلومات التي ننشدها. واستنادًا إلى 
المشكلة التي نتناولهاء فإن هناك فئات عديدة من النماذجء بالإضافة إلى أنه Ls Ll‏ يكون هناك 
العديد من التقنيات المتخصصة لحل كل مشكلة منها. وفي هذا الفصل سوف نتعرف على اثنين من 
أساليب النمذجة المختلفة. ومن الجدير بالذكر أن معظم الجامعات لديها العديد من الدورات 
التدريبية التي تغطي هذه الموضوعات تحت عناوين مختلفة مثل بحوث العمليات» وعلوم الإدارة, 
las‏ دعم القرارء والمحاكاة التي يمكنها مساعدتك في بناء المزيد من الخبرات في هذه المواضيع. 
ونظرًا لأن التحليلات التوجيهية تنطوي Šole‏ على تطبيق نماذج eol‏ فإن مصطلح ele‏ البيانات 
أحيانًا يرتبط بتطبيق مثل هذه النماذج الرياضية بشكل أكثر انتشارًا. وقبل أن نتعرف على دعم 
النمذجة الرياضية في التحليلات التوجيهيةء دعونا نفهم أولًا بعض مشاكل النماذج. 
تحديد المشكلة والتحليل البيئي: 

لا يتم اتخاذ القرارات من فراغ بل لابد من تحليل نطاق المجال وقوى وديناميكيات البيئة, 
حيث يحتاج صانع القرار إلى تحديد الثقافة التنظيمية وعمليات صنع القرار في الشركات (على 
سبيل JEL‏ من يقوم باتخاذ القرارات» ودرجة المركزية). فمن الوارد أن يكون ظهور المشكلة 
الحالية سببه العوامل البيئيةء وهذا قد يسمى بشكل رسمي المسح والتحليل البيئي» ويقصد به 
رصد المعلومات المجمعة ومسحها وتفسيرها. ويمكن لأدوات ذكاء الأعمال / تحليلات الأعمال 
(BI/BA)‏ أن تساعد في تحديد المشاكل عن طريق القيام بعملية مسح لها. وينبغي أن تكون 
المشكلة مفهومة diay‏ كما يجب أن يشارك الجميع نفس إطار الفهم نظرًا لأن ا مشكلة سوف 
ينم تمثيلها في النهاية بالنموذج بشكل أو بآخر. وبغير OB «S‏ النموذج لن يساعد gilo‏ القرار. 

تحديد المتغير: يُعد تحديد متغيرات النموذج (مثل: القرارء والنتيجةء وعدم التحكم فيهما)» 
بالإضافة إلى العلاقات بين المتغيرات» أمرًا بالغ الأهمية. ويمكن أن يكون لتأثير الرسوم البيانية 
-والتي تعد نماذج تخطيطية للنماذج الرياضية - دور في تسهيل عملية التحديد. كما قد يساعد 
شكل أكثر عمومية لرسم بياني مؤثر وخريطة معرفية» gilo‏ القرار على تطوير فهم المشكلة 
بشكل أفضلء لاسيما المتغيرات وتفاعلاتها. 

التنبؤ (تحليلات توجيهية): وكما ذكرنا سابقًاء فإن معرفة ما حدث وما هو محتمل حدوثه 
يُعد شرطًا أساسيًا هاما للتحليلات التوضيحية. ويُعتبر هذا النوع من التحليلات التنبؤية ضروريًا 
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لبناء النماذج ومعالجتها نظرًا لأن النتائج dll‏ على تنفيذ القرار Sole‏ ما تظهر في المستقبل. 
وليس هناك جدوى من إجراء تحليل ملعرفة مدى (الاستجابة) على ما وقع في امماضي لأن القرارات 
التي سيتم اتخاذها في ذلك الوقت لن تجدي نفعًا في المستقبل. وتتطلب التجارة عبر الإنترنت 
والاتصالات التنبؤ Le‏ قد يحدث وتوافر المعلومات المتاحة من أجل أدائها. وهذه الأنشطة تحدث 
dde pus‏ بعد gaz‏ المعلومات حول المشتريات والتي ينبغي تحليلها للوصول إلى التوقعات» حيث 
ينطوي جزء من التحليل ببساطة على التنبؤ بالطلب؛ ومع ذلك فإن نموذج التنبؤ يمكنه استخدام 
احتياجات دورة حياة guti‏ والمعلومات التي تتعلق بالسوق والمستهلكين لتحليل الوضع بأكمله 
مما يؤدي إلى زيادة مبيعات المنتجات والخدمات بشكل مثالي. 

à‏ الحالة العملية (Y-I)‏ سوف نقدم JÈL os‏ فعال Jl‏ هذه التنبؤات واستخدامها في صنع القرار. 


حالة عملية Y‏ 
استخدام تطبيقات ذكاء الأعمال من قبل شركة إنجرام مايكرو Ingram Micro‏ من 
أجل اتخاذ قرارات التسعير 

m‏ شركة إنجرام مايكرو Ingram Micro‏ هي أكبر موزع ثنائي المستوى منتجات 
التقنية في العالم. وتقوم الشركة في نظام التوزيع ذي الشقينء بشراء المنتجات من الشركات 
المصنعة لها ومن e$‏ تقوم ببيعها لتجار التجزئة الذين يقومون بدورهم ببيع هذه المنتجات 
للمستخدمين النهائيين. فمثلاد مكن شراء حزمة 365 Microsoft Office‏ من شركة 
إنجرام مايكرو Ingram Micro‏ بدلا من شرائها مباشرة من مايكروسوفت (Microsoft)‏ 
وترتبط شركة إنجرام بالعديد من الشراكات مع شركات مثل -Buffalos Best Buy‏ و 
Honeywell «Google‏ بالإضافة إلى .Sharper Images .Libratone‏ وتقوم الشركة 
بتسليم منتجاتها إلى ٠٠٠٠٠٠١‏ مزود حلول في جميع أنحاء di‏ وبالتالي فإن الشركة لديها 
حجم كبير من بيانات اللعاملات. ولتحديد فرص البيع المتقاطع وتحديد الأمعار التي 
يتم تقدهها لعملاء محددين بالتزامن مع حزم ا منتجات» أرادت شركة إنجرام استخدام 
الإحصاءات من هذه البيانات» مما يتطلب إنشاء مركز ذكاء الأعمال (BIC)‏ من أجل 
تجميع وتحليل البيانات. وقد واجهت شركة إنجرام العديد من المشاكل في إعداد 810. 
-١‏ واجهت شركة إنجرام مشاكل عديدة في عملية التقاط البيانات الخاصة بهم» مثل 
نقص بيانات الخسائرء وضمان d$»‏ معلومات المستخدم lil‏ وربط الاقتباسات بالأوامر. 





(CRM) واجهت شركة إنجرام مشاكل في تنفيذ نظام إدارة علاقات العملاء‎ Lj] -Y 
بحيث يكون قادرًا ها يكفي للتعامل مع عملياته في جميع أنحاء العام.‎ 
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"- بالإضافة إلى ما سبقء فقد واجهت الشركة تصدي لفكرة تسعير الطلب (تحديد 
السعر وفقًا للإقبال على المنتج). 

المنهجية / الحل: 

استكشفت شركة إنجرام البريد الإلكتروني واستخدمته في التواصل المباشر مع عملائها 
(البائعين) وقدمت لهم خصومات على شراء التقنيات الداعمة المتعلقة با منتجات 
المطلوبة. ومن خلال تحليل سلة السوق المجزأة استطاعوا تحديد هذه الفرص ومن 
تم طوروا تطبيقات ذكاء الأعمال التالية التي ساعدت في تحديد الأسعار المثلى. كما 
قامت إنجرام بتطوير أداة جديدة لتحسين الأسعار وتُعرف باسم IMPRIME‏ وهذه 
الأداة يمكنها تحديد الأسعار القائمة على البيانات بالإضافة إلى قدرتها على توفير إرشادات 
التفاوض المستندة إلى البيانات. حيث تحدد IMPRIME‏ السعر الأمثل لكل مستوى 
من مستويات التسلسل الهرمي للمنتج (مثل: مستوى العميلء ومستوى البائع-العميل. 
ومستوى شريحة العميل» ومستوى شريحة البائع-العميل). وهي تقوم Jai‏ ذلك من 
خلال مراعاة المفاضلة بين إشارة الطلب والتسعير عند ذلك المستوى. 

كما قامت الشركة بتطوير برنامج تسويق رقمي يُعرف باسم Intelligence INGRAM‏ 
حيث يستخدم هذا البرنامج التسجيل الإرشادي التنبؤي (PLS)‏ والذي يحدد 
المستخدمين النهائيين المُستَهدفين ببرامج تسويقية محددة. ويُعد (PLS)‏ هو نظامهم 
الذي eal a‏ لتسجيل الإرشادات التنبؤية للشركات التي ليس لها علاقة مباشرة مع 
المستخدمين النهائيين. كما يُستخدم برنامج Intelligence INGRAM‏ لتشغيل gol»‏ 
الفضاء الأبيض» مما gaii‏ المورّد على شراء المنتجات المرتبطة ببعضها من خلال تقديم 
خصومات. فعلى سبيل JEA‏ إذا كان Áh‏ يشتري خادمًا من إنجرام» $us‏ تقوم 
إنجرام بتقديم خصومات على وحدات تخزين الأقراص نظرًا للترابط بين المنتجين» حيث 
إنهما مطلوبان للعمل bbg a‏ فإنه يتم استخدام تقنية Intelligence INGRAM‏ 
من أجل تطوير الحملات التحفيزية (وذلك من خلال تقديم مكافآت نقدية للموردين 
على تجاوز أهداف الإنفاق الربع سنوية)» وحملات البيع المتبادل (إرسال البريد الإلكتروني 
للمستخدمين بخصوص النتجات المرتبطة باممنتج الذي تم شراؤه مؤخرًا). 

النتائج / الفوائد: 





وتُستخدم منهجية قياس الرقع لقياس الأرباح الناتجة وذلك عن طريق استخدام 
أداة IMPRIME‏ حيث تقوم هذه المنهجية (منهجية قياس الرفع) بمقارنة الفترات قبل 
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وبعد تغيير الأسعار كما تقوم بمقارنة مجموعات الاختبار مقابل مجموعات التحكم. 
ويتم إجراء قياس الرفع على متوسط امبيعات اليومية والهامش الإجمالي» وهامش 
الماكينة. وقد أدى استخدام أداة IMPRIME‏ إلى نمو في الإيرادات بلغ VOV‏ مليون دولار 
وزيادة في إجمالي الأرباح بلغت ۱۸,۸ مليون دولار. 

أسئلة للمناقشة: 

-١‏ ما هي أهم التحديات التي واجهتها إنجرام مایکرو Ingram Micro‏ في تطوير 810؟ 

-Y‏ اذكر جميع حلول ذكاء الأعمال التي طورتها شركة إنجرام لتحسين أسعار منتجاتها 


وللتعرف على عملائها. 
-Y‏ ما هي الفوائد التي حصلت lade‏ إنجرام بعد استخدام تطبيقات ذكاء الأعمال 
المطورة حديئًا؟ 


ما الذي يمكن أن نتعلمه من هذه الحالة العملية؟ 

تستطيع الشركة أن تبدأ بفهم خطوط منتجاتهاء وعملائهاء بالإضافة إلى ble‏ الشراء 
الخاصة بهم بشكل أفضلء من خلال BIC slu‏ لأول مرة. وتُستمّد هذه البصيرة من ما 
نسميه بالتحليلات الوصفية والتنبؤية. وبالإضافة إلى ذلك فإن القيمة من هذا تُسِتَمّد 
من خلال تحسين lead‏ وهو أحد مجالات التحليلات التوجيهية. 
Sources: Mookherjee, R., Martineau, J., Xu, L., Gullo, M., Zhou, K., Hazlewood,‏ 
A., Zhang, X., Griarte, E, & Li, N. (2016). End-to-end predictive analytics and‏ 
optimization in Ingram Micros two-tier distribution business. Interfaces, 46(1), 4973-;‏ 


ingrammicrocommerce.com, "CUSTOMERS; https://www.ingrammicrocommerce. 


com/customers/(accessed July 2016). 


فئات النموذج: 

يصنف الجدول )1-1( بعض نماذج القرارات إلى سبع مجموعات ويسرد العديد من التقنيات 
الممثلة لكل فئة من الفئات؛ حيث يمكن تطبيق كل تقنية إما على نموذج ثابت أو نموذج dio‏ 
والذي هكن بناؤه في بيئات مفترضة من aS LUE‏ أو عدم التأكد. أو الخطر. ويمكن استخدام أنظمة 
تحليل القرارات الخاصة والتي يحتوي تصميمها على لغات وإمكانيات نمذجة مدمجة فيهاء بغرض 
تسريع عملية البناء النموذجية, ويش مل ذلك جداول البيانات» وأنظمة التنقيب في البيانات, 
وأنظمة المعالجة التحليلية عبر الإنترنت (OLAP)‏ ولغات النمذجة التي تساعد المحلل على بناء 


ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري o£!‏ 


هذه الإدارة مساعدة أنظمة الإدارة القائمة على النماذج» 
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موذج. وسوف نتناول أحد هذه الأنظمة لاحقًا في هذا الفصل. 
إدارة النموذج: وللحفاظ على سلامة النماذج وبالتالي قابليتها للتطبيق فإنه ينبغي أن تتم 


As 


حيث تتم 


إدارة gòl‏ مثل البيانات؛ 


والتي تشبه أنظمة إدارة قواعد البيانات (DBMS)‏ 
النمذجة المستندة إلى المعرفة: تستخدم أنظمة دعم القرار النماذج الكمية في الغالب» في حين 
تستخدم النظم الخبيرة نماذج نوعية تعتمد على المعرفة في تطبيقاتها. الجدير بالذكر أن بعض ال معرفة 
تكون ضرورية لبناء نماذج قابلة Jal‏ (وبالتالي فإنها تكون قابلة للاستخدام). ولبناء نماذج قائمة على 
المعرفة, فإنه يمكن استخدام العديد من تقنيات التحليلات التنبؤيةء مثل: التصنيف والتجميع. 


جدول 1-5: فثات النماذج 





التقنيات الممثلة 


العملية والهدف 


ali 





جداول القرارات. وأشجار 
القراره وعملية التسلسل الهرمي 
التحليلي. 


البحث عن أفضل حل من بين 
عدد قليل من البدائل. 


البحث عن الحل الأمثل للمشاكل 
من خلال بعض البدائل القليلة. 





نماذج البرمجة الخطية والرياضية 
الأخرىء ونماذج الشبكات. 


بعض نماذج المخزون. 


البحث عن أفضل حل من بين 
عدد كبير من البدائل. باستخدام 
عملية التحسين خطوة بخطوة. 

البحث عن أفضل الحلول في 
خطوة واحدة باستخدام صيغة ما. 


البحث عن الحل الأمثل عن 
طريق خوارزمية. 


البحث عن الحل الأمثل من 























المحاكاة. البحث عن حل جيد بدرجة كافية | عدة أنواع من المحاكاة. 
أو الحل الأفضل من بين البدائل 
التي تم فحصهاء وذلك من خلال 
استخدام التجريب. 
الاستدلال. العثور على حل جيد بدرجة ASS‏ | برمجة إرشاديةء وأنظمة خبيرة. 
عن طريق استخدام القواعد. 
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الفتة العملية والهدف التقنيات الممثلة 
تماذج تنبؤية. التنبق بالمستقبل بالنسبة لسيناريو | نماذج التنبق وتحليل ماركوف 
معين. .Markof‏ 
تماذج أخرى. وضع حل في حالة ”ماذا - لو“ | النمذجة AJU‏ وخطوط 
باستخدام صيغة ما. الانتظار. 

















الاتجاهات الحالية في النمذجة: ينطوى أحد الاتجاهات الحديثة في النمذجة على تطوير مكتبات 
نموذجية ومكتبات تقنية Jodl‏ وبعض هذه الرموز يمكن تشغيلها مباشرةً على خادم الويب الخاص 
بالمالك dla‏ والبعض الآخر کن تنزيله وتشغيله على جهاز حاسب محاي» حيث إن توافر هذه 
الرموز يعني أن حزم التحسين والمحاكاة القوية متاحة لصانعي القرار الذين من الممكن أن يقوموا 
باختبار هذه الأدوات فقط من منظور مشاكل الفصل الدراسي. فعلى سبيل «JEU‏ يحتفظ قسم 
الرياضيات وعلوم الحاسب في مختبر أرغون (Argonne, Illinois) Argonne National, ib g)‏ 
بخادم 95 من أجل التحسين على موقع .https;//neos-server.org/neos/index.html‏ كما 
يمكنك العثور على روابط لمواقع أخرى عن طريق النقر على رابط ام وارد في الموقع. Org‏ الموقع 
الإلكتروني sanb‏ بحوث العمليات وعلوم الإدارة (INFORMS)‏ حيث يوفر INFORMS‏ معلومات 
غزيرة حول النمذجة والحلول. وهثل موقع OR/MS Today‏ الموقع الإلكتروني لأحد منشورات 
INFORMS‏ وهو متاح على: .http///www.ormstoday.org/ormsmain‏ كما يتضمن Shortly‏ 
روابط للعديد من فئات goly‏ النمذجة. وسوف نتناول بعضًا منها K‏ 


وهناك اتجاه واضح نحو تطوير واستخدام أدوات وبرامج تسمى cloud-based‏ من أجل 
الوصول إلى البرامج وحتى تشغيلها من أجل أداء النمذجة والتحسين والمحاكاة وما إلى ذلك. وهذا 
يبسط تطبيق العديد من النماذج لمشاكل العام الحقيقي بطرق عديدة. ومع ذلك فمن الضروري 
اكتساب الخبرة جيدًا من خلال تطوير الحلول البسيطة» وذلك من أجل استخدام النماذج وتقنيات 
الحلول بفاعلية. وغالبًا ما يتم تجاهل هذ! الجانب. فالمنظمات التي لديها مُحللين رئيسين والذين 
يدركون بالفعل كيفية تطبيق النماذج» يطبقونها بفاعلية كبيرة. liag‏ يحدث بشكل ملحوظ في 
منطقة إدارة الإيرادات» والتي انتقلت من مقاطعة شركات الطيران والفنادق وتأجير السيارات 
إلى التجزئة والتأمين والترفيه والعديد من المجالات الأخرى. كما أن LÀ] CRM‏ تستخدم نماذج» 
غير أنها CIS‏ ما تكون شفافة للمستخدم. وتعتبر كمية البيانات وأحجام النماذج كبيرة جدًا مع 
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النماذج الإداريةء مما يستدعي استخدام مستودعات البيانات لتوفير البيانات وأجهزة الحوسبة 
المتوازية للحصول على حلول في إطار زمني معقول. 

كما أن هناك اتجاهًا مستمرًا نحو جعل نماذج التحليلات واضحة GL‏ لصانع القرار. فعلى 
سبيل «JULI‏ ينطوى التحليل متعدد الأبعاد (النمذجة) على تحليل البيانات ف أبعاد متعددة. 
وتظهر البيانات بشكل عام في التحليل متعدد الأبعاد (النمذجة) على شكل دول بیانات» بحيث 
يكون معظم صناع القرار على دراية بها. ويستخدم الآن العديد من صناع القرار الذين اعتادوا 
على تشريح وتقطيع مكعبات البيانات» أنظمة OLAP‏ التي تصل إلى مستودعات البيانات. وعلى 
الرغم من أن هذه الطرق قد تجعل النمذجة مستساغة: إلا أنها LE‏ تخرج العديد من فئات 
النماذج الهامة والقابلة للتطبيق من الاعتبارء كما أنها تقضي على بعض جوانب تفسير الحلول 
الهامة والدقيقة. وتتضمن النمذجة ما هو أكثر بكثير من مجرد تحليل البيانات مع خطوط 
الانجاه وإقامة علاقات مع الأساليب الإحصائية. 

وهناك أيضًا اتجاه «UJ‏ نمموذج من نموذج للمساعدة في تحليله بحيث يكون الرسم التخطيطي 
المؤثر عبارة عن تمثيل dle‏ لنموذج؛ وهذا هو ما يُقصد به نموذج من نموذج. كما أن بعض حزم 
برامج الرسم التخطيطي المؤثرة تستطيع إنشاء وحل النموذج الناتج. 
أسئلة مراجعة على القسم Y-A‏ 
-١‏ اذكر ثلاثة دروس مستفادة من النمذجة. 
-Y‏ اذكر مع الوصف المشاكل الرئيسة في النمذجة. 
-Y‏ ما هي الأنواع الرئيسة من النماذج المستخدمة في SDSS‏ 
£- اذا لا يتم استخدام النماذج في الصناعة بشكل متكرر كما ينبغي أو كما يمكن أن تكون؟ 
0- ما هي الاتجاهات الحالية في النمذجة؟ 


٣-٠‏ هيكل النماذج الرياضية لدعم القرار: 
في الأقسام AJI‏ سوف نتناول موضوعات النماذج الرياضية التحليلية (كالنماذج الرياضية 
واطالية والهندسية). وسوف يتضمن ذلك polis‏ وهياكل النماذج. 
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التحليلات التوجيهية: التحسين والمحاكاة 


مكونات النماذج الرياضية لدعم القرار: 

تتكون جميع النماذج الكمية ole‏ من أربعة polis‏ أساسية (انظر الشكل (Y‏ وهي: متغيرات 
النتيجة sl)‏ الحصيلة (outcome‏ ومتغيرات القرارء والمتغيرات الغير قابلة للتحكم lads gl)‏ 
15 بالإضافة إلى متغيرات النتائج المتوسطةء حيث تقوم العلاقات الرياضية بربط هذه 
العناصر ببعضها البعض. وتكون العلاقات رمزية أو نوعية في النماذج غير الكمية. وبناءً على القرار 
المتخذ (أي: قيم متغيرات القرار)» والعوامل التي لا هكن التحكم فيها من قبل صانع القرار (في البيئة)» 
والعلاقات بين المتغيرات» فإنه يتم تحديد نتائج القرارات. وتنطوي عملية النمذجة على تحديد المتغيرات 
والعلاقات فيما بينهاء حيث يُحدد حل النموذج قيم هذه المتغيرات ومتغير (متغيرات) النتيجة. 


























شكل 1-5: الهيكل العام لنموذج كمي 


متغيرات النتيجة (الحصيلة (OUTCOME‏ تعكس متغيرات النتيجة (الحصيلة (outcome‏ 
مدى فاعلية النظام؛ بمعنى أنها تشير إلى مدى جودة النظام أو تحقيق هدفه (أهدافه). وهذه 
المتغيرات هي مخرجات. وقد وردت أمثلة لمتغيرات النتائج في الجدول (Y-I)‏ وتعتبر متغيرات 
النتائج متغيرات تابعة. كما ُستخدم متغيرات النتائج المتوسطة أحيانًا في النمذجة لتحديد النتائج 
المتوسطة. ds‏ حالة المتغير التابع» ينبغي Vol‏ وقوع حدث آخر قبل وقوع الحدث الموصوف بواسطة 
المتغير. وتعتمد متغيرات النتائج على حدوث متغيرات القرار والمتغيرات التي لا يمكن التحكم فيها. 

متغيرات القرار: تصف متغيرات القرار مسارات بديلة للعمل. ويتحكم صانع القرار في 
متغيرات القرار. فعلى سبيل «JUL‏ بالنسبة لمش كلة الاستثمار» فإن مبلغ الاستثمار في السندات 
هو متغير القرار. وفي مشكلة الجدولةء فإن متغيرات القرار تكون أشخاصًا وأوقانًا وجداول. وقد 
وردت أمثلة أخرى à‏ الجدول (Q7).‏ 

المتغيرات الغير قابلة للتحكم أو :parameters ci Ill‏ هناك عوامل تؤثر على متغيرات 
النتائج في أي موقف لاتخاذ القرارء غير أن هذه العوامل خارج نطاق سيطرة gilo‏ القرار. وهذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oto‏ 


الفصل السادس 


العوامل إما أن تكون ثابتةء وف هذه الحالة تسمى متغيرات غير قابلة للتحكم أو cales‏ 
«parameters‏ وإما أن تكون قابلة للتغين وق هذه الحالة تسمى المتغيرات. ومن أمثلة العوامل 
سعر الفائدة الأساسي ورمز UL‏ في المدينة واللوائح الضريبية وتكاليف المرافق. ومعظم هذه 
العوامل لا يمكن التحكم فيها نظرًا لكونها موجودة ومحددة من قبل عناصر بيئة النظام التي 
يعمل فيها gilo‏ القرار. كما أن بعض هذه المتغيرات يُقَيّد glo‏ القرارء ios‏ فإنها JŠ‏ ما 
يُسمى بالقيود المفروضة على المشكلة. 

متغيرات النتائج ا لمتوسطة: تعكس متغيرات النتائج المتوسطة الحصيلة المتوسطة في النماذج 
الرياضية. فمثلاء عند تحديد جدولة «I‏ فإن التلف يكون هو متوسط متغير الناتج» ويكون 
الربح الإجمالي هو متغير النتيجة (أي إن التلف هو أحد العوامل المحددة لإجمالي الربح). ومثال 
آخر: هو رواتب الموظفينء ويُشكل هذا متغير قرار الإدارة؛ إذ يحدد مدى ارتياح الموظفين (أي: 
الحصيلة ا متوسطة) والذي يحدد بدوره مستوى الإنتاجية (أي: النتيجة النهائية). 


جدول :Y-‏ أمثلة لعناصر النماذج 
































متغيرات ومَعْلَمَات 
المنطقة متغيرات القرار متغيرات النتيجة 8 
غير قابلة للتحكم 
الريح» وال 
مجموع الربح» والخطر معدل ا 
معدل العائد على الاستثمار (ROL)‏ 
الاستثمار المالى | بدائل الاستثمار ومبالغه i‏ معدل الفائدة 
ET P‏ 
ربحية pied‏ المنافسة 
مستوى السيولة 
ميزانية الإعلان الحصة التسويقية دخْل العميل 
التسويق M . . f‏ 
مكان الإعلان رضا العملاء إجراءات المنافس 
نوعية انتج وكميته التكلفة الإجمالية سعة الماكينة 
التصنيع مستويات المخزون مستوى الجودة التقنية 
برامج التعويض ارتياح bohl‏ أسعار المواد 
5 تقنية الحاسب 
استخدام أجهزة الحاسب | تكلفة معالجة البيانات i‏ : 
المحاسبة pes j‏ معدلات الضرائب 
١‏ جدول التدقيق نسبة الخطأ 
i 3‏ المتطليات القانونية 
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3 7 متغيرات las‏ 
امنطقة متغيرات القرار متغيرات النتيجة 
مجموع تكلفة النقل 
جدول الشحنات 3 وع 3 مسافة التسليم 
وسائل النقل — | قيمة x Payment ¿häll Lög‏ 
استخدام البطاقات الذكية القوانين 
float time‏ 
الخدمات مستويات التوظيف ارتياح العملاء الطلب على الخدمات 





هيكل النماذج الرياضية لدعم القرار: 
ترتبط عناصر النموذج الكمي بواسطة التعبيرات الرياضية (الجبرية) - المعادلات أو التباين. 
وفيما يلي نموذج مالي بسيط P-R-CHe‏ 


حيث Rs qa Jl = P‏ = الإيرادات» Cs‏ = التكلفة. وتصف هذه المعادلة العلاقة بين المتغيرات. 
وهناك نموذج مالي آخر معروف هو نموذج التدفق النقدي البسيط للقيمة الحالية حيث P‏ = القيمة 


الحالية» و۴ = دفعة واحدة مستقبلية بالدولان و¡ = سعر الفائدة (النسبة المئوية)» ومح عدد 
السنوات. ويمكن مع هذا النموذج تحديد القيمة الحالية لدفع مبلغ 5٠٠٠٠٠١‏ يتم سداده بعد O‏ 


سنوات من الیوم» axe‏ فائدة “٠١‏ )5( على النحو التالي: AWAYE O (oA +A) ۱۰۰,۰۰۰ = P‏ 
وفيما يلي من أقسام سوف نقدم نماذج رياضية أكثر تشويقًا وتعقيدًا. 
أسئلة مراجعة على القسم 5-": 
-١‏ ما هو متغير القرار؟ 
-Y‏ اذكر وناقش بإيجاز العناصر الرئيسة للنموذج الكمي. 
-Y‏ اشرح دور متغيرات النتائج المتوسطة. 
Si >‏ وعدم التأكد والخطر: 
تنطوي عملية اتخاذ القرار على تقييم ومقارنة البدائل. ومن الضروري خلال هذه العملية, 
التنبؤ بالنتائج المستقبلية لكل بديل مقترح. وغالبًا ما يتم تصنيف حالات القرار على أساس ما 
يعرفه sl)‏ ما يعتقده) glo‏ القرار بشأن النتائج المتوقعة. oleg‏ ما نقوم بتصنيف هذه المعرفة 
إلى ثلاث فئات (انظر الشكل dY-‏ بد١‏ من المعرفة الكاملة إلى الجهل الكاملء وهي: 
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الفصل السادس 


- التأكد. - عدم التأكد. - الخطر. 

وقد تحدث أي حالة من هذه الحالات عندما نقوم بتطوير النماذج» ولكل حالة أنواع 
مختلفة من النماذج تكون مناسبة لها. وفيما يلي سوف نناقش كلا من التعريفات الأساسية لهذه 
المصطلحات وبعض قضايا النمذجة الهامة لكل حالة. 








الجهل التام : المعرفة الكاملة 
عدم التأكد الخطر التأكد 











ب ————— — 
المعرفة المتناقضة 











شكل 7-5: مناطق اتخاذ القرار 

اتخاذ القرار في ظل التأكد: 

من المفترض أن ال معرفة الكاملة تكون متاحة بالنسبة لصانع القرار عند اتخاذ القرار في JB‏ 
التأكدء بحيث يكون صانع القرار على علم تام بنتيجة كل مسار من العمل (كما لو كان في بيئة 
حتمية). وقد لا يكون صحيحًا أن معرفة النتائج تكون بنسبة ٠٠١‏ كما لا يلزم إجراء تقييم 
حقيقي لكل النتائج» غير أنه غالبًا ما يقوم هذا الافتراض بتبسيط النموذج ويجعله قابلًا للتتبعع 
حيث يُنظر إلى glo‏ القرار على اعتبار أنه متنبئ مثالي للمستقبل نظرًا لأنه من المفترض أن هناك 
نتيجة واحدة فقط لكل بديل. فعلى سبيل ال مثالء بديل الاستثمار في سندات الخزانة الأمريكية 
هو الذي تتوفر به معلومات كاملة حول عائد الاستثمار المستقبلي إذا تم الاحتفاظ به حتى 
الاستحقاق. وغالبًا ما تحدث حالة اتخاذ القرار في ظل التأكدء مع مشاكل هيكلية وآفاق زمنية 
قصيرة (تصل إلى سنة واحدة). وعد النماذج القائمة على التأكد سهلة نسبيًا في تطويرها وحلهاء 
كما يمكنها تقديم الحلول AI‏ ويتم إنشاء العديد من النماذج المالية في ظل تأكد مفترض» على 
الرغم من أن السوق لا يقبل إلا بدرجة تأكد XV‏ 


اتخاذ القرار في ظل عدم التأكد: 


في حالة اتخاذ القرار في ظل عدم as tI‏ فإن صانع القرار يأخذ في الاعتبار الحالات التي تكون 
فيها عدة نتائج ممكنة لكل مسار das‏ وهذه الحالة على النقيض من وضع الخطرء حيث إن صانع 
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التحليلات التوجيهية: التحسين والمحاكاة 


القرار في هذه الحالة لا يعرف أو لا يمكنه تقدير احتمالية حدوث النتائج الممكنة. ويُعد اتخاذ 
القرار في ظل عدم التأكد أكثر صعوبة من اتخاذه في ظل التأكد بسبب عدم توافر معلومات كافية. 
وينطوي وضع النماذج لمثل هذه الحالات على تقييم موقف صانع القرار (أو المنظمة) تجاه الخطر. 

ويحاول المديرون تجنب حالة عدم التأكد قدر الإمكانء إلى الدرجة التي تجعلهم يستبعدونه 
حتى من مجرد الافتراض. فهم يحاولون الحصول على مزيد من المعلومات بحيث يكن التعامل 
مع المشكلة في ظل التأكد (لأنه قد يكون «شبه» مؤكد) أو تحت خطر محسوب (أي: مفترض). 
s‏ حالة عدم توفر المزيد من المعلومات» ينبغي معالجة المشكلة تبعًا لحالة عدم التأكد. والتي 
قد تكون أقل تحديدًا من الفئات الأخرى. 


اتخاذ القرار في ظل الخطر (تحليل الخطر): 

يُقصد بالقرار الذي يُتخذ في ظل الخطر (المعروف أيضًا بحالة اتخاذ القرار الاحتمالي أو العشوائي) 
بأنه القرار الذي يجب أن يأخذ فيه صانع القرار بعين الاعتبار عدة نتائج ممكنة لكل بديلء ولكل 
Laio‏ احتمال حدوث معين. ومن المفترض أن تكون احتمالات حدوث النتائج المحددة على المدى 
الطويل معروفة أو هكن تقديرها. ومن خلال هذه الافتراضات» يس تطيع gilo‏ القرار تقييم درجة 
الخطر المرتبط بكل بديل (يسمى الخطر المحسوب). ومن الجدير بالذكر أن معظم القرارات 
التجارية الرئيسة يتم اتخاذها في ظل الخطر المفترض. أما Jalos‏ الخطر (أي: الخطر المحسوب) 
فهي طريقة صنع القرار التي تحلل الخطر lo)‏ على الاحتمالات المعروفة المفترضة) ales LI‏ بالبدائل 
المختلفة. ويمكن إجراء تحليل الخطر عن طريق حساب القيمة المتوقعة لكل بديل واختيار البديل 
ذي القيمة المتوقعة الأفضل. وتوضح الحالة العملية (Y)‏ تطبيقًا واحدًا لتقليل عدم التأكد. 


حالة عملية Y-3‏ 
استخدام الخطوط الجوية الأمريكية نمذجة التكلفة اللازمة لتقييم عدم التأكد من 
عطاءات طرق الشحن 
تعد شركة الخطوط الجوية الأمريكية sa (AA) American Airlines, Inc‏ أكبر 
شركات الطيران في العام. وأما الأعمال الأساسية للشركة فتتمثل في نقل الركاب» بالإضافة 
إلى أن لديها وظائف فرعية حيوية أخرى تتضمن الشحن الكامل للشاحنات (FTL)‏ من 
معدات الصيانة وشحنات sgi‏ خدمة المسافرين والتي يمكنها إضافة ما يزيد عن مليار 
دولار في ا مخزون في أي وقت. وتتلقى AA‏ عروض عديدة من الموردين استجابةٌ لطلبات 
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عروض الأسعار requests for quotes (RFQs)‏ من أجل قوائم الجرد. وقد يزيد إجمالي 
طلبات عروض الأسعار RFQs‏ لشركة AA‏ عن ٠٠١‏ طلب عرض أسعار في أي ele‏ ونتيجة 
للعدد الكبير من عروض التسعير وعملية تقديم العطاءات ا لمعقدة الناتجة. فإن عروض 
أسعار الإعلانات تختلف بشكل كبير. وفي بعض الأحيانء فإنه يمكن لعقد واحد الانحراف 
بنحو XY-‏ ونتيجة لهذه العملية المعقدة, فإنه من الشائح قيام الموردين إما بدفع مبالخ 
زائدة أو عدم دفعها من أجل الحصول على خدماتهم. وتحقيقًا لهذه الغايةء فقد أرادت 
شركة الخطوط الأمريكية الجوية بناء نموذج شراء من شأنه تبسيط وتقييم عروض الأسعار 
من الموردين من أجل اختيار عروض أسعار عادلة لكلا الطرفين ومورديهم. 

المنهجية / الحل: 

وقد تم اتخاذ ثلاث خطوات. لتحديد التكلفة العادلة منتجات وخدمات الموردين» وهي: 

-١‏ استقصاء المصادر الأساسية (كالمقابلات) والثانوية (كالإنترنت) Éa‏ عن الحالة الأساسية 
وبيانات المجال والتي من شأنها الإخبار عن متغيرات التكلفة التي تؤثر على عرض FTL‏ 

-Y‏ اختيار متغيرات التكلفة بحيث تكون حصرية تبادلية وجماعية شاملة. 

-Y‏ استخدام برنامج تحليل قرار DPL‏ لتوضيح عدم التأكد. 

bodes‏ على US‏ فقد استخدمت Swanson Megill‏ التقريب الموسع لنمذجة 
توزيع الاحتمالات للمتغيرات الأكثر حساسية من حيث التكلفة المستخدمة. وقد تم 
ذلك لحساب التقلبات العالية في عروض الأسعار في النموذج الأولي. 

النتائج / الفوائد: 

تم إجراء اختبار تجريبي على طلبات عروض الأسعار التي جذبت عروض من ست 
ناقلات .FTL‏ وقد كان من بين العروض الست المقدمة خمسة عروض ضمن ثلاثة 
انحرافات معيارية عن المتوسطء في حين eiu‏ السادس. وقد استخدمت AA‏ في وقت 
لاحق نموذج FTL‏ للتكلفة اللازمة لأكثر من ۲۰ طلب سعر RFQs‏ من أجل تحديد 
التكلفة العادلة والدقيقة للسلع والخدمات. ومن المتوقع أن يساعد هذا النموذج في 
الحد من الأخطار التي تتعلق إما بالدفع الزائد أو دفع تعويضات للموردين. 

أسئلة للمناقشة: 


-١‏ إلى جانب الحد من خطر الدقع الزائد أو دفع تعويضات للموردينء ما هي بعض 
المميزات الأخرى التي تستطيع شركة AA‏ أن تستمدها من «تموذج ما ينبغي أن يكون»؟ 


.00 ذكاء الأعمال والتحليلات وعلم «LI‏ منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


-Y‏ هل هكنك التفكير à‏ المجالات الأخرى التي يمكن استخدام هذا gògail‏ فيها 
إلى جانب مجال النقل الجوي؟ 

-Y‏ ناقش الطرق الأخرى ا ممكنة التي تستطيع من خلالها شركة AA‏ أن تحل مشكلة 
دفع مبالغ زائدة ومقدار المدفوعات. 
Source: Adapted from Bailey, M. J., Snapp, [., Yetur, S., Stonebraker, S., Edwards, S.‏ 
A., Davis, A., & Cox, R. (2011). Practice summaries: American Airlines uses should-‏ 


cost modeling to assess the uncertainty of bids for its full-truckload shipment routes. 


Interfaces, 41(2), 194196-. 


أسئلة مراجعة على القسم £71: 
-١‏ وضح معنى القيام بعملية اتخاذ القرار في ظل التأكد المفترضء والخطرء وعدم التأكد. 
-Y‏ كيف هكن التعامل مع مشاكل guo‏ القرار في ظل التأكد المفترض؟ 
-Y‏ كيف هكن معالجة مشاكل صنع القرار في Jb‏ عدم التأكد المفترض؟ 
-E‏ كيف هكن التعامل مع مشاكل guo‏ القرار في JE‏ الخطر المفترض؟ 
0-5 نمذجة القرار باستخدام جداول البيانات: 

يمكن تطوير النماذج وتنفيذها في مجموعة متنوعة من لغات البرمجة والأنظمة. ونحن نركز 
في e LAU‏ الأول على جداول البيانات (مع إضافاتهم)» ونماذج اللغات» بالإضافة إلى أدوات تحليل 
البيانات الواضحة. وسرعان ما تم الاعتراف بحزم جداول البيانات باعتبارها برنامج تنفيذ هكن 
استخدامه بسهولة من أجل تطوير مجموعة واسعة من التطبيقات فى مجال الأعمال والهندسة 
والرياضيات والعلوم. وتشتمل جداول البيانات على الإحصائيات والتوقعات الشاملة: بالإضافة 
إلى التصميمات الأخرىء وقدرات إدارة قواعد البيانات» والمهام» والروتين. وقد تم تطوير الوظائف 
الإضافية مع تطور حزم جداول البيانات» وذلك من أجل هيكلة Jos‏ فئات معينة من النماذج. 
ومن بين الحزم المضافة. تم تطوير العديد منها من أجل تطوير DSS‏ وتتضمن هذه الوظائف 
الإضافية المرتبطة بأنظمة دعم القرار SIS‏ من: 
(Frontline Systems Inc., solver.com) Solver -‏ 
!'What'sBest -‏ (إصدار Lindo‏ من أنظمة ليندو (Inc., lindo.com; Lindo Systems‏ من 

أجل الأداء الخطي والغير خطي الأمثل. 
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(Jurik Research Software, Inc., jurikres.com) Braincel - 
(Palisade Corp., palisade.com) Neural Tools الأدوات العصبية‎ - 
artificial neural networks الشبكات العصبية الاصطناعية‎ - 
للخوار زميات الجينية.‎ (Palisade Corp) Evolver BU - 
لأداء دراسات المحاكاة.‎ (Palisade Corp) @RISK الخطر‎ - 

وتتوفر الوظائف الإضافية القابلة للمقارنة مجانًا أو بتكلفة منخفضة جدًا. (يمكنك إجراء 
بحث على الويب حتى تتمكن من الوصول إليها؛ فهي je‏ إضافة جديدة منتظمة إلى السوق). 
ونظرًا لأن جدول البيانات يضم العديد من الوظائف المالية والإحصائية والرياضية وغيرها من 
الوظائف القويةء فهو يُعد أداة النمذجة الأوسع انتشارًا للمستخدم النهائي. وتستطيع جداول 
البيانات تنفيذ مهام الحلول النموذجية مثل البرمجة الخطية وتحليل الانحدار. وقد تطور جدول 
البيانات إلى أداة مهمة للتحليل والتخطيط والنمذجة (انظر Farasyn, Perkoz, & Van de Velde,‏ 
Hurley & Balez, 2008; Ovchinnikov & Milner, 2008‏ ;2008(- وتقدم الحالتان العمليتان (5-5) 
و(0-5) تطبيقات مثيرة للاهتمام للنماذج المستندة إلى جداول البيانات في dio‏ غير ربحية. 


حالة عملية 6-5 
استخدام بنسيلفينيا أدوبشن (Pennsylvania Adoption Exchange) il}‏ 
لنموذج جدول البيانات من أجل تحسين تطابق الأطفال مع الأسر 

تم تأسيس Pennsylvania Adoption Exchange (PAE)‏ في عام 191/5 من قبل 
ولاية بنسلفانيا لمساعدة المقاطعات والوكالات غير الهادفة للربح في العثور على عائلات 
محتملة للأطفال اليتامى الذين م يقم أحد بتبنّيهم بسبب العمر أو الاحتياجات الخاصة. 
وتحتفظ PAE‏ بسجلات مفصلة عن الأطفال وتفضيلات الأسر التي من المحتمل أن تقوم 
بتبنّيهم. كما تبحث عن عائلات للأطفال في جميع المقاطعات ال۷٦‏ في ولاية بنسلفانيا. 
ass‏ شبكة بنسلفانيا uz‏ والاستدامة هي المسؤولة على مستوى الولاية عن إيجاد 
منازل دائمة للأيتام. فإذ! فشلت الشبكة بعد عدة محاولات في وضع طفل مع عائلة, فإنها 
حینئذ تحصل على مساعدة من .PAE‏ وتستخدم PAE‏ أداة تقييم آلية لتنسيق وضع 
الأطفال مح العائلات المناسبة لهم» حيث تقدم هذه الأداة توصيات للتوفيق من خلال 
حساب النتيجة بين ٠‏ و١٠٠*‏ للطفل على VA‏ 195 من قيم سمات الطفل والتفضيلات 
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العائلية. وقد كافحت PAE‏ لعدة سنوات من أجل إعطاء توصيات توفيق التبنّي بين 
الأطفال والأسر التي تناسبهم للأخصائيين المسؤولين عن حالات الأطفال. غير أنهم وجدوا 
صعوبة في إدارة قاعدة بيانات واسعة من الأطفال التي تم جمعها رور الوقت على 
مستوى جميع المقاطعات ال1۷. وقد قدمت خوارزمية البحث الرئيسة توصيات للتوفيق 
أثبتت أنها غير مثمرة للأخصائيين المسؤولين عن الحالات. ونتيجة لذلك؛ فقد olj‏ عدد 
الأطفال الذين b‏ يتم egis‏ زيادة ls‏ وأصبحت الحاجة ملحة لإيجاد أسر لهؤلاء الأيتام. 

المنهجية / الحل: 

PAE clo‏ بجمع المعلومات عن كل من الأيتام والعائلات عن طريق الاستطلاعات 
عبر الإنترنت والتي تشمل مجموعة جديدة من الأسئلة؛ حيث تعمل هذه الأسئلة على 
جمع المعلومات الخاصة بهوايات الطفل وتفضيلات الأخصائيين المسؤولين عن الأطفال 
للعائلات» وفثة الأطفال العمرية المفضلة من قبل العائلات. وقد PAE Lol‏ والأطباء 
الأخصائيون أداة لتوفيق جداول البيانات» وقد اشتملت هذه الأداة على مميزات إضافية 
إذا ما قورنت بالأداة الإضافية التي استُخدمت سابقًا. ويستطيع الأخصائيون المسؤولون 
عن الحالات في هذا النموذج تحديد أهمية السمات من أجل اختيار عائلة لطفل. 
a tas‏ إذا كانت إحدى العائلات لديها مجموعة محدودة من التفضيلات التي تتعلق 
بنوع الطفل» وعمره» 48,65« فإن هذه العوامل هكن أن تصبح ذات أهمية أعلى. 
وبالإضافة إلى US‏ فإن الأخصائيين المسؤولين عن الحالات يمكنهم أن يعطوا الأفضلية 
حول المقاطعة التي تقيم بها الأسرة. نظرًا لأهمية عامل العلاقة الاجتماعية بالنسبة 
للطفل. وتستطيع لجنة التوفيق باستخدام هذه الأداة مقارنة الطفل والأسرة في كل 
daw‏ مما يؤدي إلى جعل قرار التوفيق بين كل من الأسرة والطفل أكثر دقة. 

النتائج / الفوائد: 





منذ أن بدأت PAE‏ باستخدام نموذج جدول البيانات الجديد من أجل التوفيق بين 
عائلة وأحد الأطفالء استطاعوا اتخاذ قرارات خاصة بالتوفيق «asl‏ مما أدى إلى ارتفاع 
نسبة الأطفال الذين يحصلون على منزل دائم. 

وتمثل هذه الحالة القصيرة مثالًا olg‏ من العديد من الأمثلة التي تستخدم جداول 
البيانات كأداة لدعم القرارء حيث يتم إنشاء نظام مطابقة أفضل بين رغبات العائلة 
التي ترغب في التبنّي وسمات الطفلء من خلال إنشاء نظام تسجيل بسيط لرغبة العائلة 
وسمة الطفل بحيث يتم الإبلاغ عن عدد أقل من حالات الرفض GÙ‏ من الجانبين. 
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أسئلة للمناقشة: 
-١‏ ما هي التحديات التي واجهتها PAE‏ أثناء اتخاذ قرارات توفيق حالات التبنّي؟ 
-Y‏ ما هي مميزات أداة جدول البيانات الجديدة التي ساعدت PAE‏ في حل JSU‏ 
التي تتعلق بالتوفيق بين عائلة وطفل؟ 
Source: Adapted from Slaugh, V. W., Akan, M., Kesten, O., & Unver, M. U. (2016).‏ 


The Pennsylvania Adoption Exchange improves its matching process. Interfaces, 
46(2), 133154-. 


حالة عملية 0-5 
استخدام مؤسسة مترو ميلز أون وييلز تريجر dB‏ 
(Metro Meals on Wheels Treasure Valley)‏ لبرنامج Excel‏ من أجل البحث 
عن خطوط السير GM‏ للتسليم 

Meals on Wheels Association of America‏ (وتسمى الآن 
(Meals on Wheels America‏ وهي منظمة غير ربحية تقوم بتقديم 
ما يقرب من مليون وجبة إلى منازل كبار السن المحتاجين عبر الولايات 
المتحدة. Metro Meals on Wheels Treasure Valley sùg‏ فرعا Lála‏ 
ل Meals on Wheels America‏ يعمل à‏ إيداهو (Idaho)‏ حيث يحتوي هذا 
الفرع على فريق من السائقين المتطوعين الذين يستخدمون سياراتهم الشخصية 
كل يوم من أجل تقديم الوجبات إلى ۸۰۰ عميل على طول YY‏ مسارًا ويغطون 
مساحة تبلغ Y,V£O‏ كيلومتر مربع. 

وقد واجهت منظمة Meals on Wheels Treasure Valley‏ العديد من 
المشاكل. أما المشكلة الأولىء فقد تمثلت في تطلعهم إلى تقليل وقت التسليم حيث 
كان الطعام المطبوخ حساسًا لدرجة الحرارة ومن الممكن أن يفسد بسهولة. وقد 
كانوا يرغبون في توصيل الطعام المطبوخ في غضون ٠١‏ دقيقة من بعد مغادرة 
السائق من أجل توصيل الطعام. وأما المشكلة الثانيةء فقد تمثلت في استغراق 
عملية الجدولة وقنّا طويلا Jiz‏ وقد قضى اثنان من الموظفين الكثير من وقتهم 
في تطوير مسارات مجدولة من أجل التوصيل. وقد قدم منسق خطوط السير 
بتحديد عدد مرات التوقف وفقًا لعدد متلقي الوجبات ليوم معين. وبعد تحديد 
نقاط 1521« el‏ المنسق بعمل سلس AL‏ من التوقفات التي قللت من وقت 
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سفر المتطوعين. وبعد ذلك يتم إدخال جدول خط السير في أداة عبر الإنترنت 
لتحويل تعليمات القيادة للسائقين. وقد كانت عملية تحديد خطوط السير يدويًا 
تستغرق الكثير من الوقت الإضافي. وتحتاج MMW‏ إلى أداة تمكنها من تحسين 
نظام التوصيل الخاص بهم فضلًا عن قدرتها على تقديم حلول توجيه لكل من 
اتجاهات الذهاب والعودة لتوصيل وجبات الطعام. ويمكن لأولئك الذين يقودون 
بانتظام أن يقوموا بتوصيل الطعام الدافئ أو البارد في اليوم التالي. أما الأشخاص 
الآخرون الذين يقومون بقيادة السيارات فقط في بعض الأحيانء فإنهم يحتاجون 
إلى العودة إلى المطبخ أحيانًا لتوصيل الأطعمة الدافئة / المبردة. 
المنهجية / الحل: 

تم تطوير أداة تعتمد على جدول البيانات» من أجل حل مشكلة خط السير. 
حيث تحتوي هذه الأداة على واجهة لإدخال المعلومات الخاصة بالمستلم بسهولة 
مثل اسمه / اسمها ومتطلبات الوجبةء وعنوان التسليم» حيث ينبغي ملء هذه 
المعلومات في جدول البيانات لكل نقطة توقف في خط السيرء ثم بعد ذلك تم 
استخدام برنامج Excel's Visual Basic‏ لوظيفة التطبيقات من أجل الوصول إلى 
واجهة برمجة تطبيقات خرائط الشبكة للمطورين (API)‏ والتي تسمى -MapQuest‏ 
وقد تم استخدام هذه الواجهة الخاصة ببرمجة التطبيقات API‏ لإنشاء مصفوفة 
سفر تقوم بحساب الوقت والمسافة اللازمة لتوصيل الوجبةء حيث تعطي هذه الأداة 
معلومات عن الوقت والمسافة ل٠٠٠٠‏ زوج من المواقع يوميًا بدون أي تكلفة. 

وعند بدء التشغيل يقوم MapQuest API‏ أولًا بالتأكد من صحة العناوين 
المدخلة لمتلقي الوجبات. ثم يستخدم البرنامج واجهة برمجة التطبيقات (API)‏ 
للحصول على مسافة القيادةء والوقت المتوقع GLAU‏ وتغيير التعليمات للقيادة 
بين جميع نقاط التوقف في الطريق. وبعد US‏ تستطيع الأداة الوصول إلى Ye‏ 
محطة خلال فترة زمنية ممكنة. 
النتائج / الفوائد: 

أدى استخدام هذه الأداة. إلى انخفاض إجمالي مسافة القيادة السنوية بمقدار 
٠‏ ميلء بينما قل وقت السفر بمقدار ٥۴١‏ ساعة. وقد وفرت وجبات Metro‏ 
à $0,۸۰۰ Meals on Wheels Treasure Valley‏ عام ۰٥‏ اعتمادًا على معدل 
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توفير يقدر ب JI) 5٠,08‏ سيارة سيدان متوسطة الحجم). كما استطاعت هذه 

الأداة تقليل الوقت المستغرق في تخطيط خط السير لتوصيل الوجبات. كما تضمنت 

المزايا الأخرى زيادة رضا المتطوعين بالإضافة إلى زيادة فرص الاحتفاظ بهم. 

أسئلة للمناقشة: 

-١‏ ما هي التحديات المتعلقة بتوصيل الوجبة التي واجهت 
Metro Meals on Wheels Treasure Valley related‏ قبل اعتماد الأداة 
المستندة إلى جدول البيانات؟ 





-Y‏ وضح تصميم نموذج يستند إلى جدول البيانات. 

Metro Meals on Wheels ما هى الفوائد غير الملموسة التى حصلت عليها‎ -Y 
sExcel استخدام نموذج يستند إلى‎ Vi 

Source: Adapted from Manikas, A. S., Kroes, J. R., & Gattiker, T. F. (2016). Metro 


Meals on Wheels Treasure Valley employs a low- cost routing tool to improve 
deliveries. Interfaces, 46(2), 154167-. 


تنطوي المميزات المهمة الأخرى لجدول البيانات على تحليلات ”ماذا - لو“ والبحث عن 
الهدف. بالإضافة إلى إدارة البيانات» وقابلية البرمجة (أي وحدات ا ماكرو). ويمكن بسهولة تغيير 
قيمة الخلية والاطلاع فورًا على النتيجةء باستخدام جدول البيانات. كما يتم تنفيذ البحث عن 
الهدف من خلال الإشارة إلى خلية الهدف والقيمة المطلوبة والخلية المتغيرة. ويمكن تنفيذ إدارة 
Bas‏ بيانات واسعة مع مجموعات بيانات Sgro‏ أو أجزاء من قاعدة بيانات يمكن استيرادها 
للتحليل (والذي هو في الأساس كيفية عمل OLAP‏ مع مكعبات البيانات متعددة الأبعاد. وفي 
الواقع» فإن معظم أنظمة OLAP‏ لديها الشكل والمظهر من برامج جداول البيانات المتقدمة بعد 
تنزيل البيانات)» وتقوم قوالب ووحدات SW‏ والأدوات الأخرى بتعزيز إنتاجية بناء -DSS‏ 

ونظرًا لأن حزم جداول البيانات تقرأ وتكتب بنى ملفات شائعة وتتفاعل بسهولة مع قواعد 
البيانات والأدوات الأخرى؛ فإن معظمها يوفر تكاملًا سلسًا إلى حد ما. ass‏ مايكروسوفت إكسل 
هي حزمة جدول البيانات الأكثر انتشارًا. وفي الشكل (P-Y‏ نقوم بعرض نموذج حساب قرض 
بسيط حيث تصف المربعات في جدول البيانات محتويات الخلاياء والتي تحتوي على صيغ؛ حيث 
يظهر تغيير في معدل الفائدة في الخلية EV‏ على الفور في الدفع الشهري في الخلية ENY‏ ومن 
الممكن ملاحظة النتائج وتحليلها على الفور. فإذا كنا بحاجة إلى دفعة شهرية محددةء فيمكننا 
استخدام البحث عن الهدف بغرض تحديد سعر فائدة مناسب أو مبلغ قرض. 
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الجدير بالذكر أن جدول الحسابات الموضح في الشكل (Y-I‏ ثابت. وعلى الرغم من تأثير 
المشكلة على المقترض e‏ 5 الوقت» إلا أن النموذج يشير إلى أداء شهر واحد, والذي يتم تكراره. 
deg‏ النقيضء فإن النموذج الحركي هثل السلوك ,55 الوقت. كما تشير حسابات القروض في 
جدول البيانات الموضحة في الشكل )£7( إلى تأثير الدفع المسبق على المبلغ الأصلي بمرور الوقت. 
وباس تخدام مولدات رقمية عشوائية مدمجة لتطوير نماذج ا محاكاةء هكن دمج تحليل الخطر في 
جداول البيانات (انظر الفصل التالي). 


^ 5 c o t 3 e 
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شكل 5-: مثال نموذج لجداول Excel‏ الإحصائية لحساب قرض بسيط هدفوعات شهرية 
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شكل :t-1‏ مثال نموذج ديناميكي لجداول بيانات Excel‏ لحساب قرض بسيط مدفوعات شهرية 
وتأثيرات الدفع المسبق 
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ويتم الإبلاغ عن تطبيقات جداول البيانات للنماذج بانتظام. وفي القسم UII‏ سوف نتعلم 
كيفية استخدام نموذج تحسين يعتمد على جدول البيانات. 


أسئلة مراجعة على القسم 0-5: 

-١‏ ما هو جدول البيانات؟ 

SDSS ماذا أضاف جدول البيانات؟ وكيف تساعد هذه الإضافة في إنشاء واستخدام‎ -Y 
-DSS يودي جدول البيانات إلى تطوير نظام‎ BU اشرح‎ -Y 


7-1 تحسين البرمجة الرياضية: 

إن البرمجة الرياضية هي مجموعة من الأدوات التي صُممت من أجل المساعدة في حل 
المشاكل الإدارية والتي ينبغي أن يقوم فيها صانع القرار بتخصيص موارد نادرة بين الأنشطة 
المتنافسة من أجل تحسين هدف قابل للقياس. فعلى سبيل «JULI‏ يعتبر توزيع وقت الماكينة 
(المورد) بين المنتجات المختلفة (الأنشطة) مشكلة تخصيص نموذجية. وتُعد البرمجة الخطية 
(LP)‏ أفضل تقنية معروفة في عائلة أدوات التحسين والتي تسمى البرمجة الرياضية؛ حيث 
تكون كافة العلاقات بين المتغيرات خطية في LP‏ كما يتم استخدامه على نطاق واسع في نظام 
الترصد الدهوغرافي (انظر الحالة العملية .)1-١‏ وتتميز نماذج البرمجة الخطية بأن لديها العديد 
من التطبيقات المهمة في الممارسة. وتتضمن هذه التطبيقات إدارة سلسلة التوريد, وقرارات 
مزج المنتجات, والتوجيهء وغير EUS‏ ومن ال ممكن استخدام أشكال خاصة من النماذج لأجل 
تطبيقات محددة. فعلى سبيل JÈL‏ تصف الحالة العملية )1-1( نموذج جدول البيانات الذي 
تم استخدامه لإنشاء جدول زمني للأطباء. 


حالة عملية 5-5 
مساعدة موذج البرمجة العددية المختلطة مركز جامعة تينيسي (Tennessee)‏ الطبي 
في وضع جدول مواعيد الأطباء 
إن مؤسسة الأطفال حديثي الولادة الإقليمية Regional Neonatal Associates‏ هي 
عبارة عن مجموعة تضم تسعة أطباء يعملون في وحدة العناية المركزة لحديثي الولادة 
à (NICU)‏ 554 الطبي لجامعة تينيسي (Tennessee)‏ في نوكسفيل Knoxville)‏ 
تينيسي (Tennessee)‏ كما تخدم المجموعة أيضًا اثنتين من ا مستشفيات المحلية في 
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منطقة نوكس فيل (Knoxville)‏ لأغراض الطوارئ. ولعدة ستوات» يقوم عضو واحد في 
ا مجموعة بوضع جدول مواعيد الأطباء Gous‏ لعدة سنوات» بيد أنه مع إقتراب تقاعده, 
كانت هناك حاجة إلى نظام أكثر تلقائية لوضع جدول مواعيد الأطباء. وقد رغب الأطباء 
في أن يكون هذا النظام BoB‏ على موازنة عبء العمل الخاص بهم» حيث م تستطع 
الجداول السابقة موازنة عبء العمل بينهم بشكل مناسب. وبالإضافة إلى «AUS‏ فإن 
الجدول الزمني يحتاج لضمان تواجد الأطباء YE‏ ساعة V‏ أيام في الأسبوع لتغطية وحدة 
العناية المركزة لحديثي الولادة NICU‏ من قبل الأطباء. وإذا أمكنء يقوم هذا النظام 
باستيعاب التفضيلات الفردية للأطباء لأنواع التناوب. ولمعالجة هذه المشكلة. قام 
الأطباء بالاتصال بكلية العلوم الإدارية في جامعة تينيسي (Tennessee)‏ 

وقد تميزت مشكلة جدولة مواعيد الأطباء إلى نوبات بأنها كانت تقوم على أساس 
قيود عبء العمل وخيارات نمط الحياة. وقد تمثلت الخطوة الأولى لحل مشكلة في 
الجدولة وهي تجميع النوبات Áss‏ لأنواعها XJ)‏ ونهارًا). أما الخطوة التالية فقد تمثلت 
في تحديد قيود المشكلة. ويحتاج النموذج لتغطية فترة تسعة أسابيع بتسعة أطباء 
مع اثنين من الأطباء يعملون طوال أيام Eoad‏ وطبيب واحد ds Í‏ عطلات نهاية 
الأمبوع. بالإضافة إلى ضرورة تعيين طبيب واحد فقط لتغطية YE‏ ساعة يوميًا لسبعة 
eb‏ في الأسبوع للمستشفتّين المحليّين. كما تحتاج القيود الواضحة الأخرى أيضًا إلى النظر 
فيها. فعلى سبيل JUL‏ لا هكن تكليف طبيب بوردية نهارية بعد قضائه لوردية ليلية. 

المنهجية / الحل: 

تم صياغة ا لمشكلة من خلال إنشاء نموذج تحسين عددي مختلط. وقد قسم 
النموذج الأول حجم العمل بين تسعة أطباء بالتساوي. غير أن هذا النموذج b‏ يستطع 
أن يحدد عددًا متساويًا من النوبات الليلية والنهارية بين الأطباء. وقد نشأ عن ذلك 
مسألة التوزيع العادل. وبالإضافة إلى ذلكء فقد كان للأطباء آراء مختلفة حول عبء 
العمل المحدد. وقد أراد ستة أطباء وضع جدول زمني يتم فيه تعيين عددٍ متساو من 
النوبات النهارية والليلية لكل طبيب في الجدول الزمني الذي يستغرق تسعة à aola‏ 
حين يرغب الآخرون بوضع جدول زمني SU‏ على تفضيل كل فرد من الأطباء للنوبات. 
ومن أجل ذلك تم تشكيل نموذج جديد يمكنه تلبية متطلبات كلا الفريقين من الأطباء 
(La Lus‏ هذا النموذج بنموذج جدولة التفضيلات المختلطة (HPSM)‏ ومن أجل تلبية 
متطلبات ا مساواة للستة أطباء الذين رغبوا في EUS‏ قام النموذج Ío‏ بحساب حجم 
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العمل لمدة أسبوع واحد ثم قسمه لمدة تسعة أسابيع بالنسبة لهم. وبهذه Äi hll‏ 
استطاع تقسيم العمل بالتساوي بين جميع الأطباء الستة. ثم قام بتقسيم عبء العمل 
للثلاثة أطباء المتبقين في الجدول الزمني Bal‏ تسعة أسابيع وفقًا لتفضيلاتهم. ومن ثم 
قام الأطباء بمراجعة الجدول الزمني الناتج فوجدوه أكثر "s‏ 
النتائج / الفوائد: 
استطاعت طريقة جدولة التفضيلات المختلطة HPSM‏ أن تستوعب كلا من متطلبات 
المساواة ومتطلبات الأفضلية الفردية للأطباء. وبالإضافة إلى US‏ فقد تمكّنت الجداول 
من هذا النموذج من تقديم أوقات راحة أفضل للأطباء مقارنةٌ بالجداول الزمنية السابقة, 
فضلًا عن إمكانية تلبية طلبات الإجازات في الجداول. كما يستطيع نموذج HPSM‏ حل 
مشاكل الجدولة المشابهة التي تتطلب التفضيلات النسبية بين أنواع النوبات. 
وتستطيع بعض التقنيات من مثل نماذج البرمجة العددية المختلطة أن تقوم بإنشاء 
الجداول الى فضلًا عن قدرتها على المساعدة في العمليات. وقد تم استخدام هذه 
التقنيات في المؤسسات الكبيرة لفترة طويلة. والآن يمكن تنفيذ مثل هذه النماذج التحليلية 
التوضيحية في جداول البيانات وغيرها من البرامج المتاحة بسهولة. 
أسئلة للمناقشة: 
-١‏ ما هي المشكلة التي واجهت مؤسسة الأطفال حديثي الولادة الإقليمية؟ 
-Y‏ كيف استطاع نموذج HPSM‏ تلبية جميع متطلبات الأطباء؟ 
Source: Adapted from Bowers, M. R., Noon, C. E., Wu, W., & Bass, J. K. (2016).‏ 
Neonatal physician scheduling at the University of Tennessee Medical Center.‏ 
Interfaces, 46(2), 168182-.‏ 
baleg‏ ما تُظهر مشاكل توزيع البرمجة الخطية المميزات التالية: 
- هناك كمية محدودة من اموارد الاقتصادية متاحة للتخصيص. 
- تُستخدم الموارد في إنتاج المنتجات أو الخدمات. 
- يوجد طريقتان أو أكثر يمكن من خلالها استخدام اللوارد ويسمى كل منها حل أو برنامج. 
- ينتج عن كل نشاط (منتج أو خدمة) والذي يتم استخدام الموارد فيه» Ile‏ على الشروط 
الخاصة بالهدف المعلن. 
bole -‏ ما يكون التخصيص is‏ بعدة قيود ومتطلبات» تسمى القيود. 
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ويعتمد نموذج تخصيص البرمجة الخطية على الافتراضات الاقتصادية العقلانية التالية: 
- يمكن مقارنة العوائد من التخصيصات المختلفة؛ بمعنى أنه يمكن قياسها بوحدة مشتركة (مثل: 
الدولارء والفائدة). 

- العائد من أي تخصيص يكون مستقلًا عن التوزيعات الأخرى. 
- إجمالي العائد هو مجموع العوائد الناتجة عن الأنشطة المختلفة. 
- جميع البيانات معروفة على وجه التأكد. 
- استخدام الموارد بطريقة أكثر اقتصادًا. 

baleg‏ ما تتضمن مشالكل التخصيص Bus Bae‏ من الحلول الممكنة. واعتمادًا على الافتراضات 
الأماسية؛ فإن sue‏ الحلول قد يكون لا gi‏ وقد يكون محدودًا. oleg‏ ما تنتج الحلول المختلفة 
مكافآت مختلفة. ومن بين الحلول المتاحة يوجد على الأقل حل واحد يعتبر هو الأفضلء بمعنى أن 
درجة تحقيق الأهداف المرتبطة به هي الأعلى (أي إن إجمالي المكافأة هو الحد الأقصى)ء وهذا ما 
يسمى الحل Li‏ ويمكن العثور عليه باستخدام خوارزمية خاصة. 
نموذج البرمجة الخطية: 

يتكون كل نموذج برمجة خطية LP‏ من متغيرات القرار (والتي تكون قيمتها غير معروفة 
ويتم البحث (lio‏ ودالة موضوعية (دالة حسابية خطية تربط متغيرات القرار بالهدف. كما 
تأخذ ا معايير اللازمة لتحقق الأهدافء وكيفية تحسينها)» ومعاملات دالة الهدف (وحدة الربح أو 
معاملات التكلفة التي تشير إلى إسهام هدف وحدة واحدة من متغير القرار)» بالإضافة إلى القيود 
(المعبر عنها في شكل عدم مساواة خطية أو مساواة تحد من الموارد و / أو المتطلبات؛ والتي 
تقوم بربط المتغيرات من خلال العلاقات الخطية)» والقدرات (والتي تصف الحدود العليا وأحيانًا 
الحدود الدنيا حسب القيود والمتغيرات)» ومعاملات المدخلات / المخرجات (التقنية) (والتى تشير 
إلى استخدام الموارد من أجل متغير القرار). i‏ 

دعونا نتأمل هذا المثال: تحتاج شركة MBI‏ التي تقوم gua‏ أجهزة حاسب لأغراض خاصة 
إلى اتخاذ قرار بخصوص: كمْ عدد أجهزة الحاسب التي ينبغي إنتاجها الشهر Jal‏ في مصنع 
بوسطن؟ حيث تدرس MBI‏ نوعين من أجهزة الحاسب: CC-7.‏ والتي تتطلب ٠١‏ يوم من 
العمل و١٠٠٠٠5 CC-85 «olalid‏ والتي تتطلب 02٠١‏ يوم عمل و٠٠٠,٥$1‏ للخامات. وتبلغ 
قيمة المساهمة الربحية لكل جهاز 00-7 5٠,٠٠١۸‏ في حين تبلغ المساهمة الربحية لكل جهاز 
.$\Y, ++- CC-8‏ وتبلغ سعة gol‏ ۰۰۰۰۰ يوم عمل في الشهرء كما تبلغ اميزانية المادية ^ 
مليون دولار شهريًا. ويتطلب التسويق إنتاج ٠٠١‏ وحدة من 00-7 على الأقل بالإضافة إلى ما Y‏ 
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يقل عن ٠٠١‏ وحدة من CC-8‏ كل شهر. وتكمن المشكلة في زيادة أرباح الشركة إلى أقصى حد 
من خلال تحديد عدد وحدات CC-7‏ وعدد وحدات 00-8 التى ينبغى إنتاجها كل شهر. لاحظ 
أن هذا الأمر قد يستغرق شهورًا للحصول على بيانات مشكلة معينة في البيئة الواقعية, وأثناء 
جمع البيانات سيكشف صانع القرار بلا شك الحقائق حول كيفية هيكلة النموذج المطلوب حله. 
رؤية فنية :1-١‏ البرمجة الخطّية 
ربما تكون البرمجة الخطية LP‏ هي نموذج التحسين الأكثر شهرة؛ حيث يتعامل هذا 
النموذج مع التخصيص الأمثل للموارد بين الأنشطة المتنافسة. وقد تم توضيح مشكلة 
التخصيص من خلال النموذج الموضح هناء 
وتكمن المشكلة في العثور على قيم متغيرات القرار س١‏ وس۲ وغيرهاء بهدف وصول 
قيمة متغير النتيجة 7 إلى أقصى حد ممكنء مع مراعاة مجموعة من القيود الخطية التي 
تعبر عن كل من التقنية» وظروف السوقه بالإضافة إلى المتغيرات الأخرى التي لا يمكن 
التحكم فيها. أما العلاقات الرياضية فهي كل المعادلات الخطية بالإضافة إلى التباين. 
ومن الناحية النظرية» فإن أي مشكلة تخصيص من هذا النوع لديها العديد من الحلول 
الممكنة التي لا حصر لها. فمن خلال استخدام إجراءات رياضية خاصةء يطبق منهج 
البرمجة الخطية LP‏ إجراء بحث فريد يتم تنفيذها بواسطة الحاسب حيث هكنه إيجاد 
أفضل حل (حلول) في غضون old‏ فضلًا عن قدرته على توفير تحليل الحساسية «kil‏ 
النمذجة في البرمجة الخطَية LP‏ مثال: 
يمكن تطوير نموذج برمجة خطية LP‏ قياسي لمشكلة شركة MPI‏ التي ذكرناها آنقًا. وكما 
ناقشنا في الفكرة التقنية (V-I)‏ فإن نموذج البرمجة الخطية LP‏ يحتوي على ثلاثة مكونات» وهي: 
متغيرات القرار» ومتغيرات النتائج والمتغيرات التي لا يمكن التحكم فيها (القيود). 
حيث تكون متغيرات القرار كما uda‏ 





X, = units of CC — 7 to be produced 
X; = units of CC — 8 to be produced 











ويكون متغير النتيجة كما يلي: 





Total profit — Z 
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والهدف هو الوصول qu JU‏ الإجمالي إلى أقصى حد ممكن: 


Z-8,000X, + 12,000 














وتكون المتغيرات (القيود) التي لا يمكن التحكم فيها كما يلي: 


Labor constraint: 300X + 500X: = 200,000 (in days) 

















Budget constraint: 10,000X, + 15,0003 s 8,000,000 (in dollars) 
Marketing requirement for CC — 7: X, z 100 (in units) 
Marketing requirement for CC — 8: X; 2 200 (in units) 











ويلخص الشكل )0-7( هذه المعلومات. 











X, = units of CC7 
X, = units of CC-8 


300X, + 500X, < 200,000 
10,000X, + 15,000X, < 8,000,000 
X, = 100 
x, < 0 


















شكل 071: نموذج رياضي JU‏ مزيج المنتج 

وبالإضافة إلى المكونات التي ذكرت سابقًاء فإن النموذج يحتوي أيضًا على مكون رابع خفي؛ حيث 
يحتوي كل نموذج برمجة خطية LP‏ على بعض المتغيرات الوسيطة الداخلية والتي م 535 بشكل صريح. 
فعندما يكون الجانب الأيسر أقل دقة من الجانب الأمنء فإن كلا من قيود العمل واميزانية قد تسبب 
حدوث بعض الركود بهم. هذا الركود يتم تمثيله lalo‏ عن طريق متغيرات الركود التي تشير إلى وجود 
موارد زائدة متاحة. أما عندما يكون الجانب الأيسر ذا دقة أكبر من الجانب الأمن فإن قيود متطلبات 
التسويق قد يكون لدى كل منها بعض الفائض» ويتم تمثيل هذا الفائض داخليًا بواسطة المتغيرات 
الفائضة مما يدل على وجود بعض المساحة التي تتيح ضبط الجوانب اليمنى من هذه القيود. وعد كل 
من متغيرات الركود والفوائض متوسطة. كما أنها قد تكون ذات قيمة كبيرة لصانع القرار نظرًا لاستخدام 
طرق حل النماذج الخطية LP‏ لها في وضع ol‏ الحساسية لتحليلات ”ماذا - لو“ الاقتصادية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 
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ويحتوي نموذج المزيج التسويقي على عدد لا نهائي من الحلول الممكنة. فإذا افترضنا أن خطة 
الإنتاج لا تقت صر على الأعداد الصحيحة - وهو افتراض معقول في خطة الإنتاج الشهرية - فإننا نريد 
حلا يصل بإجمالي الربح إلى أقصى حد ممكنء ألا وهو الحل الأمثل. ولحسن الحظ يظهر برنامج Excel‏ 
مع الأداة الإضافية Solver‏ والتي يمكنها الحصول بسهولة على الحل الأمثل (الأفضل) لهذه المشكلة. 
وعلى الرغم من نقل موقع الوظيفة الإضافية Solver‏ من أحد الإصدارات إلى إصدار آخرء غير أنه 
مازال Glia‏ كوظيفة إضافية مجانيةء ويمكنك البحث عنه ضمن علامات تبويب البيانات وعلى شريط 
التحليل. فإنه بمكن تفعيله من خلال الانتقال إلى قائمة الخيارات في Excel‏ وتحديد الوظائف الإضافية. 

ونقوم بإدخال هذه البيانات مباشرة في جدول Excel Oblo‏ ثم نعمل على تنش یط Solver‏ 
ومن ّم نقوم بتحديد الهدف (من خلال وضع الخلية المستهدفة تساوي الحد الأقصى). بالإضافة إلى 
متغيرات القرار (عن طريق الإعداد بواسطة تغبير (LE‏ والقيود (من خلال التأكد من أن إجمالي 
العناصر المستهلكة أقل من أو يساوي aal‏ 591 ويكون أكبر من أو يساوي كلا الصفين الثالث 
والرابع). وتشكل كل من الخلايا D79 C7‏ خلايا متغير القرار. وبعد تشغيل الوظيفة الإضافية Solver‏ 
سيتم ملء النتائج في هذه الخلايا؛ حيث EV‏ هي الخلية المستهدفة» والتي تعد LÉ‏ المتغير الناتج» كما 
أنها تمثل منتجًا من خلايا متغير القرار ومعاملات الربح لكل وحدة à)‏ الخلايا (D83 C8‏ لاحظ أنه تم 
قسمة جميع الأرقام على ٠٠٠١‏ لجعل كتابتها أسهل (باستثناء متغيرات القرار). وتصف الصفوف من 
٩‏ إلى W‏ قيود المشكلة: القيود على قدرة اليد العاملةء وعلى الميزانية» بالإضافة إلى القيود على الحد 
الأدنى المطلوب لإنتاج المنتجين X,‏ و يكا. ويحدد كلا العمودين Ds C‏ معاملات هذه القيود. وينطوي 
العمود E‏ على الصيغ التي تضاعف متغيرات القرار (خلايا (D79 C7‏ مع معاملات كل logia‏ في كل 
صف. أما القيمة الجانبية لهذه القيود فيحددها العمود .F‏ ولتطوير مضاعفات الصفوف والأعمدة 
بسهولةء فإنه oce‏ استخدام إمكانيات مصفوفة إكسل «JUL daos (e)‏ دالة XSUMPRODUCT‏ 
asus‏ إعداد حسابات النموذج في Excel‏ فإن هذا هو الوقت المناسب لاستدعاء الوظيفة الإضافية 
-Solver‏ ويؤدي النقر فوق الوظيفة الإضافية ل Solver‏ (مرة أخرى ضمن مجموعة Analysis‏ ضمن 
علامة تبويب البيانات) إلى فتح مربع حوار (إطار) يتيح لك تحديد الخلايا أو النطاقات التي تحدد 
خلية دالة الهدف ومتغيرات القرار / التغيير (الخلايا) والقيود. كما نقوم LÍ‏ باختيار طريقة الحل من 
الاختيارات Bole)‏ الإرمجة الخطية البسيطة (LP‏ ومن ّم نقوم بحل المشكلة. وبعد ذلك نقوم باختيار 
التقارير الثلاثة - الإجابة والحساسية والقيود - للحصول على الحل الأمثل من 85.066.667 = الربح» 
LS X, = 333.33 X; = 0‏ يتضح من الشكل )1-7( حيث تنتج Solver‏ ثلاثة تقارير مفيدة حول 
-Jodl‏ هكنك القيام بتجربتها. وقد أصبح الآن:50176 ذا قدرة على حل مشاكل البرمجة غير الخطية 
ومشاكل البرمجة الصحيحة باستخدام أساليب Jodl‏ الأخرى المتوفرة به. 
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شكل :٦-٦‏ مثال لحل Solver‏ من Excel‏ لمزيج المنتجات 
وفيما يلي مثال لتوضيح مدى قوة نمذجة جداول بيانات دعم القرارء وقد تم وضع هذا JELI‏ 
من قبل البروفيسور Rick Wilson‏ من جامعة أوكلاهوما الحكومية. 
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شكل :V-‏ مثال لبيانات توزيع موارد الانتخابات 
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حيث يصف الجدول الوارد في الشكل (V-I)‏ بعض البيانات الافتراضية وسمات تسع «ولايات 
متقلبة» لانتخابات عام Y V‏ حيث تشمل سمات التسع ولايات oa‏ كان عددهم من الأصوات 
الانتخابيةء واثنتين من الواصفات الإقليمية (لاحظ أن هناك ثلاث ولايات تصنّف على أنها ليست 
شمالية ولا جنوبية) فضلًا عن ”وظيفة التأثير“ المقدرة والتي تتعلق بزيادة دعم المرشح لكل 
وحدة من حملات الاستثمار JUL‏ في تلك الحالة. فعلى سبيل JEM‏ ثبين دالة التأثير ۴1 أنه 
سيكون هناك زيادة إجمالية قدرها ٠١‏ وحدات في دعم الناخبين (تظل الوحدات العامة هنا كما 
هي عامة) بالنسبة لكل وحدة مالية مستثمرة في تلك الولايةء كما تتكون من زيادة في دعم الشباب 
بمقدار ثلاث وحدات» ودعم JLS‏ السن من الرجال بمقدار وحدة واحدة والنساء صغار QI‏ 
والمسنات بمقدار Y‏ وحدات لكل منهم. 

وتضم الحملة ٠١٠١‏ وحدة مالية للاستثمار في الولايات التسع؛ حيث ينبغي ألا يقل نصيب كل 
ولاية من الاستثمار عن XO‏ من إجمالي الاستثمارات الكلية» كما ينبغي ألا يزيد عن XY0‏ من إجمالي 
الاستثمارات المستثمرة في أي من الولايات. ولا يلزم استثمار جميع الوحدات البالغ عددها ٠١6١‏ 
وحدة (ينبغي أن يتعامل النموذج الخاص بك مع هذا بشكل صحيح). 

أيضًاء فإن الحملة لديها بعض القيود الأخرى. ومن وجهة نظر الاستثمار «JUI‏ فإنه ينبغي أن 
يكون لدى الولايات الغربية (إجمالًا) استثمارات في الحملات بمستوى لا يقل عن >1٠‏ من إجمالي 
المستثّمر في الولايات الشرقية. أما من حيث الأشخاص المتأثرين» فإنه ينبغي أن يؤدي قرار تخصيص 
الاستثمارات المالية للولايات إلى مالا يقل عن 57٠١‏ من إجمالي المتأثرين. وبشكل ele‏ فإنه ينبغي 
أن يكون العدد الإجمالي للإناث اممتأثرين أكبر من أو يساوي العدد الإجمالي للذكور المتأثرينء 
بالإضافة إلى أنه يجب أن يكون ZET‏ على الأقل من مجموع الأشخاص المتأثرين من «المسنين». 

Jiag‏ مهمتنا في إنشاء نموذج برمجة صحيح مناسب يحدد العدد الصحيح الأمثل (أي 
العدد الكامل) للوحدات المالية الخاصة بالولايات والتي ترفع من مجصوع منتجات وحدات 
التصويت الانتخابية» التي يتم استثمارها تبعًا للقيود الأخرى المذكورة ÉT‏ إلى أقصى حد ممكن. 
(وهكذاء وبشكل غير مباشرء فإن هذا النموذج يفضل الولايات التي تتمتع بعدد كبير من الأصوات 
الانتخابية). لاحظ أنه يجب أن تؤدي جميع القرارات الخاصة بالتخصيص في النموذج إلى قيم 
douno‏ حتى يستطيع موظفو الحملة التنفيذ بسهولة. 

واعتمادًا على الأسئلة التالية التي يجيبون عنهاء هكن تصنيف الجوانب الثلاثة الخاصة 
بالنماذج» وتتمثل هذه الأسئلة في: 


ovi‏ ذكاء الأعمال والتحليلات وعلم BLII‏ منظور إداري 
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«Nevada ما الذي نتحكم فيه؟ المبلغ المستثمر في الإعلانات عبر التسع ولايات» نيف ادا‎ -١ 
وفرجينيا‎ Ohio وأوهايو‎ Wisconsin وويسكونسن‎ dowa وأيوا‎ «Colorado وكولورادو‎ 
ونيو هامبشاير‎ Florida وفلوريدا‎ North Carolina بالإضافة إلى نورث كارولينا‎ Virginia 
WI و0115‎ JAg CO9 NV متغيرات القرار التسعة:‎ Labé والتي‎ «New Hampshire 
NH بالإضافة إلى‎ FL ونالل‎ «VA 

-Y‏ ماذا نريد أن نحقق؟ نريد تحقيق gaii‏ 8365 ممكنة للعدد الإجمالي لمكسب الأصوات 
الانتخابية. فنحن على دراية بقيمة كل صوت انتخابي في كل ولاية (EV)‏ حيث يعادل هذا 
الصوت الانتخابي EV*‏ الاستثمارات المجمعة للولايات التسع أي: 





[Max (ONV + 9CO + 61A + 10171 + 18011 + 13VA + 15NC + 29FL + 4NH) 





-Y‏ ما الذي يقيدنا؟ 
وفيما يلي القيود كما ذُكرت في وصف المشكلة: 
(T)‏ مالا يزيد عن ٠,٠٠١‏ وحدة مالية للاستثمار فيهاء أي: 
NV + CO + IA + WI + OH + VA + NC + FL + NH < = 1,050‏ 
(ب) استثمار 0> على الأقل من الإجمالي في كل ولايةء أي: 





NV > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
CO » = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
IA > > 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
WI > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
OH > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
VÀ >= 0.05 (NV + CO + IA + WI + OH + VÀ + NC + FL + NH) 
NC > = 0.05 (NV + CO + IA + WI + OH + VÀ + NC + FL + NH) 
FL» = 0.05 (NV + CO + IA + WI + OH + VÀ + NC + FL + NH) 
NH > > 0,05 (NV + CO + IA + WI + OH + VÀ + NC + FL + NH) 











ويمكننا تنفيذ هذه القيود التسع بعدة طرق عن طريق استخدام -Excel‏ 
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(g)‏ لا يزيد الاستثمار عن ZYO‏ من الإجمالي في كل ولاية. 


وكما هو الحال في (ب)» BB‏ نحتاج مرة أخرى إلى تسع قيود فردية لأننا لا نعرف كم 


من ١,١0١‏ سوف نستثمر. كما يجب أن تكون القيود بعبارات «عامة». 





NV <= 025 (NV + CO + IA + WI + OH + VAXNC + FL + NH) 
CO <= 025 (NV + CO + IA + WI + OH KR NC + FL + NH) 
خآ‎ >- as ov +o iem quidne ono no 
WI«- ا‎ MN M + VA + NC + FL+ ND 


OH <= E a الي‎ 
VA E ce Sp +FL+ NH) 
NC < = 0.25 (NV + CO+ Ò E + VA + NC + FL + NH) 
FL < =0.25 (NV + ب او مر‎ 








NH > > 0,25 (NV) EO + IA rs 





(د) يجب ألا تقل مستويات استثمار الولايات الغربية عن TV‏ من مستويات الولايات الشرقية. 





West States = NWPCO + IA + WI 
Fast States = QH + VA + NC + FL + NH 


So, (NV + CO + IA + WD > = 0.60 (OH + VÀ + NC + FL + NH). Again we can 





ويتم تنفيذ هذا القيد من خلال طرق متنوعة باستخدام -Excel‏ 
(o)‏ تأثير مالا يقل عن 97٠١‏ من مجموع الناس» ويكون كالتالي: 





(1ONV + 7,500 + 8IA + 101571 + 7.5OH  7.5VA +10 NC + 8FL + 8 NH) > = 9,200 














F1 6 women influenced, F2 = 3.5 women 
F3 3 women influenced 

F1 = 4 men influenced, F2 = 4 men 

F3 = 5 men influenced 











ذكاء الأعمال والتحليلات وعلم BLII‏ منظور إداري 


(a)‏ أن ossa‏ تأثير عدد الإناث على الأقل مثل الذكورء مما يتطلب انتقال وظائف التأثير. 


OA 


التحليلات التوجيهية: التحسين والمحاكاة 


فإذا كان إنجاز الإناث > = الذكورء فإنتا نحصل على: 





(ENV + 3500 + 3IA + OWI + 3.50H + 3.5VÀ + GNC + 3FL + 3NH) > = 
(4NV + 4CO + SIA + 4WI + 4OH + 4VA + 4NC + SFL + SNH) 











وكما هو الحال من قبلء فإنه يمكننا تنفيذ ذلك في Excel‏ بطريقتين مختلفتين. 
( ز) ينبغي ألا تقل نسبة المسنين عن ZET‏ من المجموع الكلي للأشخاص. 
وقد كان جميع الأشخاص المتأثرين على الجانب الأيسر من (e) LÄ‏ ولذلك فإن 
المسنين المتأثرين سوف يكونون كالتالي: 










(4NV + 3.500 + 45[4 + 4WI + 35OH + 3.5VA + اله‎  4.5FL + 4.5NH) 
This would be set >= 0.46* the left-hand side of int (e). (10NV + 7500+ 
BIA + 10171 + 7508 + 7.SVA 10NC + 8FL + NED! which would give a right- 
side of XN 

(0.46NV + 3.4500 + 3.681A + 4691+ e + 3.45VA + 4.6NC + 3.68FL + 
3.68NH) 





هذا هو القيد الأخير إلى جانب فرض أن تكون جميع المتغيرات أعدادًا صحيحة. 
وقد تسم ذكر كل شيء في الشروط الجبرية» وسيكون لهذا النموذج الصحيح من البرمجة ٩‏ 
متغيرات قرار و٤۲ ILS‏ (قيد واحد للمتطلبات الصحيحة). 


التنفيذ: 


سيكون أحد المناهج صارمًا في تنفيذ النموذج «النموذج القياسي» أو نموذج شكل الصف 
حيث تتم كتابة جميع القيود بمتغيرات القرار على الجانب الأيسرء وتتم كتابة رقم على الجانب 
الأمن. ويوضح الشكل (A-I)‏ مثل هذا التنفيذ. بالإضافة إلى أنه يعرض النموذج الذي تم حله. 
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شكل A-1‏ موذج لتوزيع موارد الانتخابات - إصدار قياسي 


ويمكننا بدلا من ذلك استخدام جدول البيانات لحساب أجزاء مختلفة من النموذج بطريقة 


أقل صرامةء وكذلك تنفيذ القيود المتكررة (c) (b)‏ بشكل فريد, بالإضافة إلى الحصول على جدول 


واضح في الشكل 70( 
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شكل :A-‏ معادلة مضغوطة لتوزيع موارد الانتخابات 


ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


بيانات أكثر اختصارًا (غير أنها ليست واضحة). وهذا 


ov. 


التحليلات التوجيهية: التحسين والمحاكاة 


كما يمكن Ua‏ تحديد نماذج البرمجة الخطية LP‏ (وتخصصاتها وتعميماتها) مباشرةً في عدد من 
أنظمة النمذجة الأخرى سهلة الاستخدام. ومن أشهر هذه النماذج: نموذج ليندو Lindo‏ ولينجو Lindo‏ 
(Systems, Inc., lindo.com; demos are available) Lingo‏ حيث Lindo‏ هو نموذج برمجة خطية 
LP‏ كما أنه نظام برمجة صحيح. ويتم تحديد النماذج في الأساس بالطريقة ذاتها التي يتم تحديدها بها 
جيريًا. وقد استندت الشركة على نجاح ليندو Lindo‏ تطوير لغة لينجو Lingo‏ وهي لغة النمذجة 
التي تنطوي على محسن ليندو Lindo‏ القوي والملحقات لحل المشاكل غير الخطية. وهناك العديد من 
لغات النمذحة الأخرى المتوفرة مثل: AIMMSs AMPL‏ بالإضافة إلى layt g XPRESS MPL‏ 

ومن خلال مجموعة متنوعة من أساليب البرمجة الرياضيةء هكن حل نماذج التحسين الأكثر 
شيوعًاء وتتضمن هذه الأساليب ما يلي: 


- التكليف (أفضل مطابقة للأهداف). - البرمجة الحركية. - برمجة الأهداف. 


- الاستثمار (زيادة معدل العائد). - البرمجة الخطية والصحيحة. 
- نماذج الشبكة للتخطيط والجدولة. - البرمجة غير الخطية. 
- الاستبدال (وضع ميزانية رأس المال). - النقل (تقليل تكلفة الشحنات). 


- نماذج المخزون البسيط (مثل: كمية الطلب الاقتصادية). 


أسئلة مراجعة على القسم TV‏ 

LP اذكر مع التوضيح الافتراضات المتضمنة في البرمجة الخطية‎ -١ 
اذكر مع التوضيح خصائص البرمجة الخطية.‎ -Y 

-Y‏ قم بوصف مشكلة التخصيص. 


۷-١‏ الأهداف المتعددةء وتحليل الحساسيةء وتحليل «ماذا - لو»» والبحث عن الهدف: 

تنطوي الكثير من حالات اتخاذ القرار إن مم يكن معظمهاء على التلاعب بين الأهداف المتنافسة 
والبدائل. وبالإضافة إلى ذلك فإن هناك عدم تأكد بدرجة كبيرة حول الافتراضات والتنبؤات 
المستخدمة في بناء نموذج التحليلات التوجيهية. وتقر الفقرات التالية ببساطة أنه يتم معالجتها 
أيضًا في برامج وتقنيات التحليلات التوجيهية. كما أن تغطية هذه التقنيات Bale‏ ما تكون شائعة 
في الدورات التحليلية التوضيحية أو بحوث العمليات / العلوم الإدارية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovi‏ 


الفصل السادس 


الأهداف المتعددة: 

يتم تحليل القرارات الإدارية بهدف التقييم قدر GKY‏ لمدى مساعدة كل بديل للمديرين 
على التقدم نحو أهدافهم. وللأسفء فإن تقييم المشاكل الإدارية ab‏ ما يتم بهدف واحد بسيط 
مثل: تعظيم الربح. sög‏ نظم إدارة اليوم معقدة بدرجة كبيرة» ونادرًا ما تجد أحد هذه الأنظمة 
لديها هدف واحد فقطء حيث يرغب المديرون بدلا من ذلك في تحقيق أهداف متزامنة في وقت 
واحد. والتي قد تتعارض مع بعضها البعض. الجدير بالذكر أن أصحاب المصلحة المختلفة تكون 
لديهم أهداف مختلفة. لذلكء فإنه غالبا ما يكون من الضروري تحليل كل بديل في ضوء تحديد 
كل هدف من الأهداف المتعددة (انظر 2001 (Koksalan & Zionts,‏ 

es‏ سبيل المثالء فلنعتبر أن هناك شركة تحقق أرباحًاء فإنه بالإضافة إلى هدف الشركة في 
تحقيق مكاسب ماليةء OB‏ لديها أهدافًا أخرى ترغب في تحقيقها وهي النمو وتطوير منتجاتها 
وموظفيهاء وتوفير الأمن الوظيفي لعمالهاء وخدمة المجتمع. كما يرغب المديرون في إرضاء المساهمين 
s‏ الوقت ذاته يرغبون في التمتع برواتب عالية وحسابات مصرفية.وبالإضافة إلى ذلك فإن الموظفين 
يرغبون في زيادة أجورهم واستحقاقاتهم من الأرباح. وعند اتخاذ قرار - بخصوص مشروع استشماري 
على سبيل المثال - OB‏ بعض هذه الأهداف تكمل بعضها البعضء في حين يتعارض بعضها الآخر. 
وقد وصف Kearns‏ )2004( كيف تقوم عملية التحليل الهرمي JI Uo (AHP)‏ جنب مع البرمجة 
الصحيحة: معالجة عدة أهداف في تقييم استثمارات تقنية المعلومات (IT)‏ 

وتستند العديد من النماذج الكمية لنظرية القرار على مقارنة مقياس واحد للفعالية.وبشكل 
عام» فإن ذلك يُعد شكلا من أشكال المنفعة بالنسبة لصانع القرار. ولذلك فإنه من الضروري 
bole‏ تحويل مشكلة ذات أهداف متعددة إلى مشكلة قياس فعالية واحدة قبل مقارنة آثار 
الحلول. وتعد هذه طريقة شائعة لمعالجة أهداف متعددة في نموذج LP‏ 

وهناك بعض الصعوبات التي قد تنشأ عند تحليل الأهداف المتعددة وتتمثل في: 
- صعوبة الحصول Ísle‏ على بيان صريح لأهداف المنظمة. 
- قد يقوم صانع القرار بتغيير الأهمية الخاصة بأهداف معينة مع مرور الوقت أو من أجل 

سيناريوهات القرار المختلفة. 
- النظر إلى الأهداف وا مناهج الفرعية بنظرة مختلفة على مستويات مختلفة من التنظيم وداخل 
الإدارات المختلفة. 

- الاستجابة للتغيرات في المنظمة وبيئتها مما يترتب عليه تغيير الأهداف. 


ovv‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


- قد يصعب تحديد العلاقة بين البدائل ودورها في تحديد الأهداف. 
- حل المشاكل المعقدة من قبل مجموعات من صانعي القرارء لكل واحد منهم d$)‏ شخصية 
خاصة به في تناول المشكلة. 
- قيام المشاركين بتقييم الأهمية (الأولويات) الخاصة بمختلف الأهداف» بطريقة مختلفة. 
وعند العمل مع مثل هذه الحالات» فإن هناك Sae‏ طرق هكن اس تخدامها لمعالجة الأهداف 
امتعددة وتتمثل أكثر هذه الطرق شيوعًا في: 
- نظرية ا منفعة. 
- برمجة الأهداف. 
- التعبير عن الأهداف كقيودء باستخدام LP‏ 
- نظام النقاط. 


تحليل الحساسية: 

يقوم منشئ النماذج بعمل تنبؤات وافتراضات تتعلق ببيانات المدخلات» والتي يتناول الكثير 
منها تقييم العقود الآجلة غير المؤكدة. وعندما يتم حل النموذج. فإن النتائج تعتمد على هذه 
البيانات. ويحاول تحليل الحساسية تقييم أثر التغيير في بيانات المدخلات أو ol led!‏ على الحل 
المقترح (أي: متغير النتيجة). 

ونظرًا لأن تحليل الحساسية يسمح با مرونة والتكيف مع الظروف المتغيرة ومتطلبات مختلف 
حالات اتخاذ القرار» كما أنه يوفر Kas‏ أفضل للنموذج ووضع guo‏ القرار الذي يحاول وصفهء 
ويسمح للمدير بإدخال البيانات لزيادة الثقة في النموذج. فإنه يُعد eaa‏ للغاية في التحليلات 
التوجيهية. ويقوم تحليل الحساسية باختبار العلاقات مثل: 
- أثر التغيرات في المتغيرات الخارجية (الغير قابلة للسيطرة عليها) واللغلمات parameters‏ على 

متغير النتيجة (النتائج). 

- أثر عدم التأكد في تقدير المتغيرات الخارجية. 
- تأثيرات التفاعلات المستقلة المختلفة بين المتغيرات. 
- قوة القرارات في ظل الظروف المتغيرة. 

وتستخدم تحليلات الحساسية من أجل: 
- مراجعة النماذج لاستبعاد الحساسيات الكبيرة Jg‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovy‏ 


الفصل السادس 


- إضافة تفاصيل حول المتغيرات أو السيناريوهات الحساسة. 

- الحصول على تقديرات أفضل للمتغيرات الخارجية الحساسة. 

- تغيير نظام العام الحقيقي للحد من الحساسيات الفعلية. 

- قبول واستخدام العام الحقيقي الحساس (وبالتالي سريع التآثر بالنقد)» مما يؤدي إلى المراقبة 
المستمرة والوثيقة للنتائج الفعلية. 

Ul‏ نوعا تحليلات الحساسية فهما يتمثلان في التلقائية. والتجربة والخطاً. 

- تحليل الحساسية التلقاي: يتم إجراء الحساسية JA‏ في تطبيقات نموذجية كمية قياسية 
مثل LP‏ وعلي سبيل «JEU‏ فإن هذا التحليل يقوم بالإبلاغ عن النطاق الذي يمكن أن يختلف 
فيه متغير إدخال معين أو قيمة مَعْلمة (مثل: تكلفة الوحدة) دون أن يكون له أي تأثير 
خطير على الحل المقترح. وعادةً ما يقتصر تحليل الحساسية التلقائي على تغيير واحد في كل 
à, e‏ وليس لكل المتغيرات بل فقط لمتغيرات معينة. وعلى الرغم من ذلك فإن هذا التحليل 
قوي بسبب قدرته على إنشاء نطاقات وحدود بسرعة كبيرة (وبجهد حاسوبي إضافي أو بدون 
أي جهد إضافي). ويقوم Silver‏ وتقريبًا جميع حزم البرامج الأخرى Lindo Jès‏ بتوفير تحليل 
الحساسية. وبالنظر في مثال شركة MBI‏ الذي قدمناه فيما سبق. فإنه من الممكن استخدام 
تحليل الحساسية لتحديد ما إذا كان الجانب الأيمن من القيد التسويقى على 00-8 بواسطة 
وحدة واحدة فإن صافي الربح سيزيد بمقدار VYYY.YY‏ $. وهذا التناقص إلى الصفر يكون 
صحيحًا بالنسبة إلى الجانب الأيمن. كما يمكن إجراء تحليل إضافي كبير على طول هذه الخطوط. 

- تحليل الحساسية والكشف عن الأخطاء: من خلال نهج التجربة والخطأ البسيط يمكن تحديد 
تأثير التغييرات في أي متغير, أو في عدة متغيرات؛ حيث هكنك تغيير بعض بيانات الإدخال وحل 
المشكلة مرة أخرى. وبتكرار التغييرات Bas‏ مرات» فإنه قد يتم اكتشاف حلول أفضل وأحسن. 
ومثل هذا الاختبار والذي يسهل تنفيذه عند استخدام برامج النمذجة المناسبة, مثل: برنامج 
Excel‏ له أسلوبان: تحليل ”ماذا - لو“ بالإضافة إلى البحث عن الهدف -Goal Seeking‏ 


تحليل ”ماذا - لو“: 
وقد أنشئ تحليل ”ماذا - لو“ على أساس سؤال ماذا سيحدث JU‏ إذا تم تغيير متغير إدخال 
أو افتراض أو قيمة مَعْلمة؟ وفيما يلي بعض الأمثلة: 
- ماذا سيحدث لإجمالي تكلفة ا مخزون إذا ارتفعت تكلفة حفظ المخزون بنسبة 5/٠١‏ 


- ما هى حصة السوق إذا ارتفعت ميزانية الإعلان بنسبة 3X0‏ 


ové‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


Bal طرح هذه الأنواع من الأسئلة على نموذج الحاسب والحصول على إجابات فورية‎ axis 
فإن‎ «US على‎ Soeg سهلًا بالنسبة للمديرينء إذا ما تعاملوا مع واجهة المستخدم المناسبة.‎ 
المديرين يمكنهم إجراء العديد من الحالاتء وبالتالي تغيير النسبة المئوية» أو أي بيانات أخرى في‎ 
السؤال» حسب رغبتهم. ويستطيع صانع القرار فعل كل ذلك بشكل مباشرء دون مبرمج حاسب.‎ 

ويقدم الشكل )٠١-١(‏ مثالا لجدول بيانات عن سؤال ”ماذا - لو" لمشكلة التدفق النقدي. 
فعندما يقوم المستخدم بتغيير الخلايا التي تحتوي على المبيعات الأولية (من ٠٠١‏ إلى AYE‏ 
ومعدل نمو المبيعات ×٤ EY oa)‏ لكل dgn‏ فإن البرنامج يقوم على الفور بإعادة حساب قيمة 
صافي الربح السنوي (من SYYV‏ إلى (SYAY‏ وقد كانت المبيعات الأولية في البداية ٠٠١‏ حيث نمت 
معدل XY‏ لكل ربع» محققةً Glo Goy‏ قدره SV‏ حيث يؤدي تغيير خلية المبيعات الأولية إلى 
١‏ بالإضافة إلى تغيير معدل نمو المبيعات إلى IE‏ رفع صافي الربح السنوي إلى 4x55. .$1AY‏ 








تحليل ”ماذا - لو" شائعًا في العديد من أنظمة القرار. ويتم منح المستخدمين الفرصة لتغيير 
إجاباتهم على بعض الأسئلة الخاصة بالنظام» والحصول على اقتراح JÁ‏ 

S 
s 
6 (B10 تغييم المبيعات الأولية (الحلية‎ 
7 Unk revenue $ 0 )811 ومعدل نمو المبيعات (الخلية‎ 
ais $ es Apa لتقييم التقير فى الأرياح‎ 
10 | لماعم‎ sales 
11 Sates growth rate مبيعات أولية بمقدار 100 بمعدل نمو ربع سنوی‎ 
12 127 بمفدار و يتنج ادن ربج نوی درو‎ 
13 Annal net prof : 120 تمبيعات أولية بمفدار‎ glo المقارية مع حالة‎ 
14 4% نمو ريع سنوى قدره‎ Janas 
15 
16 
17 
18 
19 
10 Seles 
21 Revenue 
22 Vereble cost 
23 Raad cost 
24 Metprofk 
25 











شكل :٠١-5‏ نموذج لحالة ”ماذا - لو“ من خلال ورقة عمل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ovo‏ 


الفصل السادس 


البحث عن الهدف :Goal Seeking‏ 


يقوم البحث عن الهدف Goal Seeking‏ بحساب قيم المدخلات اللازمة لتحقيق ال مستوى 
المطلوب من المخرجات (الهدف). ويمثل هذا النهج نهج الحل المتأخر. وفيما يلي بعض الأمثلة 
على البحث عن الهدف :Goal Seeking‏ 
- ما هي الميزانية السنوية للبحث والتطوير اللازمة لتحقيق معدل نمو سنوي بنسبة 10 بحلول عام SYM‏ 
- كم عدد الممرضات اللازمة لتقليل متوسط وقت الانتظار للمريض في غرفة الطوارئ إلى أقل من ٠١‏ دقائق؟ 

ويقدم الشكل )١١-5(‏ مثالا على البحث عن الهدف Goal Seeking‏ فعلى سبيل «JEU‏ 
معدل العائد الداخلي (IRR)‏ في نموذج التخطيط Excel (JUI‏ هو معدل الفائدة الذي ينتج قيمة 
صافية حالية (NPV)‏ صفر. ويمكننا حساب صافي القيمة الحالية للاستثمارات المخطط dad‏ من 
خلال النظر إلى تدفق العائدات السنوية في العمود E‏ كما يمكننا تحديد معدل العائد الداخلي 
من خلال تطبيق البحث عن الهدف «Goal Seeking‏ حيث تكون NPV‏ صفرًا. أما الهدف المراد 
تحقيقه والذي يحدد معدل العائد الداخلي لهذا التدفق النقديء ها في ذلك الاستثمار؛ فهو أن 
تساوي القيمة الصافية الحالية io NPV‏ وقد قمنا بتعيين خلية NPV‏ إلى القيمة ٠‏ عن طريق 
تغيير خلية معدل الفائدة. وكان الجواب 08« AYANN‏ 

















شكل 11-5: تحليل البحث عن الهدف 


ovi‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


حساب نقطة تحقيق التعادل عن طريق استخدام البحث عن الهدف :Goal Seeking‏ 
والتي as‏ تطبيقًا Ula‏ للاستهداف „Goal Seeking‏ وهذا يتضمن قيمة متغيرات القرار (مثل: 
الكمية التي يراد إنتاجها) التي تحقق ربخا صفريًا. 

وقد يكون من الصعب إجراء تحليل الحساسية في العديد من برامج التطبيقات العامة نظرًا لأن الروتين 
ا مكتوب مسبقًا Y‏ هثل bole‏ سوى فرصة محدودة لطرح أسئلة ”ماذا - لو". وينبغي أن يكون تنفيذ كل 
من lla"‏ - لو“ والبحث عن الهدف Goal Seeking‏ 54 سهلًا في نظام الترصد الديموغرافي (DSS)‏ 


أسئلة مراجعة على القسم N-I‏ 

-١‏ اذكر بعضًا من الصعوبات التي قد تظهر عند تحليل أهداف متعددة. 

-Y‏ اذكر أسباب القيام بتحليل الحساسية. 

-Y‏ وضح اذا قد يستخدم أحد المديرين تحليل ”ماذا - لو“. 

-Goal Seeking قد يقوم المدير باستخدام البحث عن الهدف‎ IU وضح‎ -E 


A-T‏ تحليل القرار باستخدام جداول القرار وأشجار القرار: 

بالنسبة لحالات القرار التي تنطوي على عدد محدود من البدائل والذي ENS‏ 
ما يكون عددًا غير oss‏ فإنه يتم تخطيطها باستخدام نهج يسمى تحليل القرار (انظر 
-(Arsham, 2006a,b; Decision Analysis Society, decision analysis. society. informs. org‏ 
حيث يتم باستخدام هذا qual‏ سرد البدائل في جدول أو رسم jlo‏ مع مساهماتها المتوقعة 
للهدف (الأهداف) بالإضافة إلى احتمالية الحصول على المساهمة. ومن الممكن تقييم ذلك من 
أجل تحديد البديل الأفضل. 

ويمكن استخدام جداول القرارات أو أشجار القرار لصياغة ح الات الأهداف الفردية. كما يمكن 
وضع أهداف متعددة (معايير) مع العديد من التقنيات الأخرى الموضحة لاحقًا في هذا الفصل. 


جداول القرارات: 


تقوم جداول القرارات بتنظيم المعلومات والمعرفة بش كل ملائم بطريقة منتظمة وجدولية 
بغرض إعدادها للتحليل. فعلى سبيل «JUL‏ لنفترض أن شركة استثمار تقوم بدراسة الاستثمار في 
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الفصل السادس 


بديل من البدائل الثلاثة: السندات. أو الأسهم. أو شهادات الإيداع ol (CDs)‏ اهتمام الشركة 
سيكون مُنْصبًا على هدف els‏ ألا وهو زيادة العائد على الاستثمار إلى أقصى حد بعد عام 
واحد. فإذا اهتمت الشركة بأهداف أخرىء مثل السلامة أو السيولةء فإنه سيتم تصنيف المشكلة 
باعتبارها aod‏ مشاكل تحليل القرارات متعدد المعايير (انظر 2001 .(Koksalan & Zions,‏ 

ويعتمد العائد على حالة الاقتصاد في وقت ما في المستقبل (غالبًا ما تسمى حالة الطبيعة)ء والتي 
يمكن أن تكون في حالة نمو قويء أو ركودء أو تضخم. وفيما يلي العوائد السنوية التي يقدرها الخبراء: 
- إذا كان الاقتصاد ينمو بقوةء فإن عائد السندات سيكون HVY‏ والأسهم 200 والودائع لأجل X10‏ 
ds -‏ حالة أن يكون الركود سائدًاء فإن عائد السندات سيكون KI‏ والأسهم AY‏ والودائع لأجل AIO‏ 
- وإذا كان التضخم هو SLI‏ فإن عائد السندات سيكون > أما الأسهم فستحقق خسارة ۲ 

وستحقق الودائع لأجل عائد 1,0. 

وتكمن المشكلة في اختيار أفضل بديل للاستثمار. ومن المفترض أن تكون هذه البدائل منفصلة. وينبغي 
التعامل مع مجموعات مثل استثمار 0٠‏ في السندات و٠0‏ في الأسهم على اعتبار أنها بدائل جديدة. 

ويمكن النظر إلى مشكلة اتخاذ القرار في الاستثمار على اعتبار أنها لعبة بين شخصين (انظر Kelly,‏ 
2. فالمستثمر guas‏ الاختيار (أي التحرك)» ومن e$‏ تحدث حالة طبيعية (يحدث التحرك). 
ويوضح الجدول (V-I)‏ مردود نموذج رياضي؛ حيث يشتمل الجدول على متغيرات القرار (البدائل)» 
ومتغيرات لا هكن السيطرة عليها (حالات الاقتصاد. مثل: البيئة)» ومتغيرات النتائج (العائد المتوقع» 
مثل: النتائج). وقد تم تصميم جميع النماذج في هذا القسم في إطار جدول بيانات. 

وإذا كان هناك مشكلة في اتخاذ القرار في ظل التأكد. فإننا سنعرف ماذا سيكون الاقتصاد كما 
يمكننا بسهولة اختيار أفضل استثمار. غير أن ذلك ليس هو الحالء ولذلك فإنه ينبغي علينا أخذ 
il>‏ عدم التأكد والخطر في الاعتبار. فمع عدم التأكد. فإننا لا نعرف احتمالات كل حالة من 
الطبيعة. ومع الخطرء سنفترض أننا نعرف الاحتمالات التي تحدث بها كل حالة من الطبيعة. 

معالجة عدم التأكد: هناك Bas‏ طرق للتعامل مع عدم التأكد. فعلى سبيل «JEU‏ فإن النهج 
التفاؤلي يفترض حدوث أفضل نتيجة ممكنة لكل بديل ومن e$‏ يختار أفضل الأفضل (أي: الأسهم). 
أما النهج التشاؤمي فإنه يفترض حدوث أسوأ نتيجة ممكنة لكل بديل ثم يختار الأفضل من بين النتائج 
(أي: شهادات الإيداع (CDs‏ وهناك نهج آخر يفترض ببساطة أن جميع حالات الطبيعة متساوية في 
الاحتمالات (انظر Clemen & Reilly, 2000; Goodwin & Wright, 2000; Kontoghiorghes,‏ 
(Rustem, & Siokos, 2002‏ وعند التعامل مع حالة عدم التأكد فإن كل نهج من هذه المناهج 
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لديه مشاكل خطيرة عند تداوله لها. وينبغي على المحلل أن يحاول جمع ما يكفي من المعلومات 
قدر الإمكان» بحيث هكن التعامل مع المشكلة في إطار التأكد أو الخطر ا مفترضة. 

معالجة الخطر: تعد طريقة اختيار البديل بأكبر قيمة متوقعة هي الطريقة الأكثر شيوعًا لحل 
مشكلة تحليل الخطر. ولنفترض أن الخبراء يقدرون فرصة النمو القوي عند “0٠‏ وفرصة الركود 
عند 21٠١‏ وفرصة التضخم عند >۲١‏ فإن جدول القرار عندئذ ستتم إعادة كتابته مع الاحتمالات 
المعروفة (انظر الجدول (Y-T‏ كما يتم حساب القيمة عن طريق ضرب النتائج (أي: النواتج) 
حسب الاحتمالات الخاصة بها وإضافتها. فعلى سبيل JEBI‏ الاستثمار في السندات يؤدي إلى عائد 
متوقع قدره عرق = )5( ۳ + )0( 1+ )50( XY‏ 

وفي بعض الأحيان فإن هذا النهج قد يكون إستراتيجية خطرة نظرًا لأن فائدة كل نتيجة 
محتملة رها تكون مختلفة عن القيمة. وحتى في حالة وجود فرصة ضئيلة لخسارة ASS‏ فإن 
القيمة المتوقعة قد تبدو معقولةء غير أن المستثمر قد يكون غير مستعد لتغطية الخسارة. فعلى 
سبيل المثال» لنفترض أن مستشارًا ls‏ يقدم لك استثمارًا «شبه مؤكد» بقيمة 5٠٠٠١‏ فإنه من 
الممكن أن يضاعف ذلك أموالك في يوم واحد. وعندئذ سيقول لك المستشار: uo"‏ هناك 
احتمال ٠,1۹۹٩‏ بأنك ستضاعف أموالك. ولكن للأسف هناك احتمال ٠,٠٠١١‏ أنك ستكون مسؤولًا 
عن خسارة $0٠٠,٠٠١‏ من حسابك". وتكون القيمة المتوقعة لهذا الاستثمار كالتالي: 
$e ae 0s -$h eee)‏ °°°( 031999 
V-‏ ,$05 - .$333 = 
SEA‏ = 

ومن الممكن أن تكون الخسارة ا محتملة كارثية لأي مستثمر صغير ليس مليارديرًا. واعتمادًا 
على قدرة المستثمر على تغطية الخسارةء فإن للاستثمار أدوات مختلفة متوقعة. ولابد أن SAS‏ 
جِيدًا أن ا مستثمر يتخذ القرار مرة واحدة فقط. 


جدول Y-Y‏ نموذج لجدول حالة الطبيعة (متغيرات لا يمكن السيطرة عليها) 

















البديل النمو القوي )4( الركود )4( التضخم (X)‏ 

um M w السندات‎ 

Mane v 10,۰ الأمهم‎ 
10 3,0 Vo CDs شهادات الإيداع‎ 
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أشجار القرار: 
تعد شجرة القرار تمثيلًا بديلا لجدول القرار (وللاطلاع على أمثلةء انظر 
(Mind Tools Ltd., mindtools. com‏ وتقوم شجرة القرار بإظهار علاقات المشكلة oL»‏ كما 
يمكنها التعامل مع حالات معقدة في نموذج مضغوط. ومع ذلك فإن شجرة القرارات قد تكون 
مُرهقة إذا كان هناك العديد من البدائل أو حالات الطبيعة. وتشتمل JS‏ من (TreeAge‏ 
Software Inc, treeage.com) TreeAge Pro (Palisade Corp., palisade. Com)‏ 
PrecisionTrees‏ على أنظمة تحليل شجرة القرار القوية والبديهية والمتطورة. كما يُقدم هؤلاء 
الموردون أيضًا أمثلة ممتازة لأشجار القرار المستخدمة في الممارسة. ومن اللاحظ أن مصطلح 
شجرة القرار قد اس تُخدم لوصف نوعين مختلفين من النماذج والخوارزميات» في حين أنه في 
السياق الحالي تشير أشجار القرار إلى تحليل السيناريو. ومن cale‏ آخرء فإن بعض خوارزميات 
التصنيف في التحليل التنبؤي (انظر الفصلين € 05( أيضًا خوارزميات شجرة القرار. 
وقد ورد في الجدول )6-1( حالة مبسطة للاستثمار لأهداف متعددة (وهي حالة اتخاذ قرار 
لتقييم البدائل بالعديد من الأهداف المتناقضة أحيانًا). وتتمثل الأهداف (المعايير) الثلاثة في كل من 
العائد والسلامة والسيولة. وهذه الحالة تم اتخاذ القرار فيها في ظل التأكد المفترض؛ بمعنى أنه يتم 
توقع نتيجة واحدة ممكنة لكل بديل؛ كما هكن أخذ حالات الخطر أو عدم التأكد الأكثر تعقيدًا هي 
الأخرى في الاعتبار. وبعض النتائج تكون نوعية (مثل: منخفضة. عالية) بدلا من أن تكون رقمية. 





جدول -£: أهداف متعددة 














شهادات الإيداع CDs‏ 3,0 مرتفعة جدًا مرتفعة 














وط مزيد من المعلومات حول تحليل القرار انظر Clemen‏ و Goodwin «(2000) Reilly‏ و )2000( 
Wright‏ بالإضافة إلى مجتمع تحليل القرار Decision Analysis Society (informs.org/Community/‏ 
deg -DAS)‏ الرغم من أن ذلك الأمر معقد للغايةء إلا أنه من ا ممكن تطبيق البرمجة الرياضية مباشرةً في 
حالات اتخاذ القرار تحت المجازفة. وسوف نناقش العديد من الطرق الأخرى لمعالجة الخطر في جزء لاحق 
من الكتاب» وهذا يتضمن المحاكاة وعوامل التأكد. بالإضافة إلى المنطق الغير واضح. 
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أسئلة مراجعة على القسم A-I‏ 

-١‏ ما هو جدول القرار؟ 

-Y‏ ما هي شجرة القرار؟ 

*- كيف هكن استخدام شجرة القرار في صنع القرار؟ 

-é‏ قم بوصف المقصود بأن يكون لديك أهداف متعددة. 


4-5 مقدمة في المحاكاة: 


نقدم في هذا القسم والقسم التالي مجموعةً من التقنيات التي تُستخدم لدعم القرار. وعلى 
نطاق واسع» فإن هذه الأساليب جميعها تقع تحت مظلة المحاكاة. وا محاكاة تمثل الواقع. وتعتبر 
المحاكاة في أنظمة القرارء تقنية لإجراء تجارب (مثل: تحليلات ”ماذا - )5( مع جهاز حاسب على 
نموذج من نظام الإدارة. وبا معنى الحرفي للكلمة فإن المحاكاة تعتبر طريقة وصفية أكثر من كونها 
إرشادية. كما أنه ليس هناك بحث تلقائي عن الحل الأمثل. وبدلًا من US‏ فإن نموذج المحاكاة 
يصف أو يتنبا بخصائص نظام معين في Jb‏ ظروف مختلفة؛ حيث يمكن اختيار أفضل البدائل 
المتعددة عندما يتم حساب قيم الخصائص. وللحصول على تقدير (وتغير) للتأثير الكلي لإجراءات 
id use‏ فإنه bole‏ ما تقوم عملية المحاكاة بتكرار التجربة عدة مرات. وتعتبر محاكاة الحاسب 
مناسبة معظم الحالات» وعلى الرغم من ذلك فإن هناك بعض عمليات المحاكاة اليدوية المعروفة 
(مثل: قيام قسم شرطة المدينة بمحاكاة جدولة سيارتها الدورية مع عجلة لعبة الكرنفال). 

وتنطوي بعض حالات اتخاذ القرار الحقيقية في العادةء على بعض العشوائية. وبسبب تعامل 
العديد من مواقف القرار مع حالات شبه منظمة أو غير منظمة» فإن الواقع معقد. إلى الدرجة 
التي قد تجعل من الصعوبة ALLE‏ عن طريق التحسين أو نماذج أخرىء ولكن يمكن استخدام 
المحاكاة لمعالجته في كثير من الأحيان. وتُعد المحاكاة واحدة من أكثر طرق دعم القرار شيوعًا. 
وللاطلاع على «s‏ انظر الحالة العملية (1-1). كما توضح الحالة العملية (V-I)‏ قيمة المحاكاة 
في بيئة لا يتوفر فيها الوقت الكافي لإجراء التجارب التحليلية. 


الخصائص الرئيسة للمحاكاة: 
Bote‏ ما تتضمن المحاكاة بناء نموذج للواقع من أجل المجال العملي. ومقارنةً بالنماذج التحليلية 
الأخرىء OB‏ نماذج المحاكاة قد تعاني من قلة عدد الافتراضات حول حالة القرار. وبالإضافة إلى 
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«els‏ فإن المحاكاة ass‏ تقنية لإجراء التجارب. ولذلككء فإنها تشتمل على اختبار قيم محددة للقرار 
أو المتغيرات التي لا هكن السيطرة عليها في النموذج مع ملاحظة التأثير على متغيرات المخرجات. 

dos‏ فإن المحاكاة لا تستخدم ole‏ إلا عندما تكون المشكلة معقدة للغاية بحيث لا يمكن 
معالجتها باستخدام تقنيات التحسين الرقمي. ويقصد بالتعقيد في هذه الحالة إما عدم إمكانية 
صياغة المشكلة من أجل التحسين (فعلى سبيل المثال: بسبب الافتراضات الغير تطبيقية)» أو أن 
الصيغة كبيرة dio‏ أو أن هناك الكثير من التفاعلات بين المتغيرات» أو أن المشكلة عشوائية في 
طبيعتها (أي: تعرض خطر أو عدم التأكد). 


حالة عملية V‏ 
محاكاة آثار تدخلات الالتهاب الكبدي B‏ 

على الرغم من قيام الولايات المتحدة باستثمارات كبيرة في مجال الرعاية الصحية, 
غير أن هناك بعض المشاكل التي تبدو وكأنها تتحدى الحل. فعلى سبيل «JUL‏ هناك 
نسبة كبيرة من السكان الآسيويين في الولايات المتحدة أكثر عرضة من غيرهم للإصابة 
بفيرس (B)‏ وإذا م يتم علاج المرض بشكل فعالء فإن واحدًا من كل أربعة أشخاص 
مصابين بالعدوى إصابة مزمنة مهدد بالإصابة بسرطان الكبد أو تليف الكبد. فضلا 
عن المشاكل الاجتماعية المرتبطة بالمرض (مثل العزل). وقد يكون التحكم في هذا 
المرض É‏ للغاية. وهناك عدد من المعايير للتحكم في ذلك المرضء وتتضمن الفحص, 
والتطعيم» وإجراءات العلاج. كما تتردد الحكومة في إنفاق الأموال على أي طريقة 
للتحكم ف المرض إلا إذا كانت فعالة من حيث التكلفة. كما أنه ليس هناك دليل على 
تحسن صحة ال مصابين بهذا المرض. وعلى الرغم من أن جميع معايير التحكم ليست 
مثالية لجميع الحالات» غير أن أفضل طريقة أو مجموعة طرق مكافحة هذا المرض غير 
معروفة حتى الآن. 

امنهجية / الحل: 

قام فريق متعدد التخصصات والذي تألف من أولئك الذين لديهم خلفيات طبية 
وإداريةء وهندسيةء بتطوير نموذج رياضي يستخدم أساليب أبحاث العمليات (OR)‏ والتي 
حددت التركيبة الصحيحة من إجراءات التحكم التي يجب استخدامها لمكافحة التهاب 
الكبد الوبائي B‏ في سكان آسيا وجزر المحيط الهادئ. foleg‏ ما يتم استخدام التجارب 
السريرية في المجال الطبي من أجل تحديد أفضل مسار للعمل في علاج الأمراض والوقاية 
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التحليلات التوجيهية: التحسين والمحاكاة 


منها. ويتمثل تعقيد هذه الحالة في كون الالتهاب الكبدي 8 يستغرق فترة طويلة غير 
معتادة من الوقت حتى يحدث تقدم. وقد تم استخدام نماذج وطرق OR‏ يسبب التكلفة 
العالية التي تصاحب التجارب السريرية في هذه الحالة. وقد قدمت مجموعة من نماذج 
ماركوف Markov‏ ونماذج اتخاذ القرار طريقة أكثر فعالية من حيث التكلفة لتحديد 
تركيبة معايير الرقابة التي يجب استخدامها في أي وقت. ويساعد نموذج القرار في قياس 
الفوائد الاقتصادية والصحية لمختلف الإمكانات الخاصة بالفحص والعلاج والتنقيح. كما 
يُستخدم نموذج ماركوف Markov‏ لنمذجة تطور الالتهاب الكبدي 8. وقد تم إنشاء 
النموذج الجديد استنادًا على المؤلفات والخبرات السابقة من أحد الباحثين بالإضافة إلى 
ما يُستمد من البيانات الفعلية الحالية للعدوى والعلاج. وقد قام صانعو السياسة ببناء 
النموذج الجديد باستخدام 4X Microsoft Excel‏ سهل الاستخدام. 

النتائج / الفوائد: 

وقد تم تحليل النموذج الناتج lie‏ ببرامج التحكم الموجودة في كل من الولايات 
المتحدة والصين. ففي الولايات المتحدة تم تطوير أربع إستراتيجيات ومقارنتها 
بالإستراتيجية الحالية. وتتمثل هذه الإستراتيجيات الأربع في: 

-١‏ يتم تطعيم جميع الأفراد. 

-Y‏ يتم فحص الأفراد Sal‏ لتحديد ما إذا كانوا مصابين بعدوى مزمنة. فإذا كانت 
الإجابة بنعم» فعندئذ يتم التعامل معهم. 








"- يتم فحص الأفراد أولًا لتحديد ما إذا كان لديهم عدوى مزمنة. فإذا كان لديهم 
العدوى. يتم علاجهم. وبالإضافة إلى ذلك يتم LÍ‏ فحص المرضى القرّبين للمصابين 
وتلقيحهم إذا لزم الأمر. 

-t‏ يتم فحص الأفراد Vol‏ لتحديد ما إذا كانوا مصابين بعدوى مزمنة أو بحاجة 
إلى تطعيم. فإذا كانوا مصابينء يتم علاجهم. وإذا كانوا بحاجة إلى التطعيم» يتم تطعيمهم. 

وقد أشارت نتائج المحاكاة إلى أن إجراء اختبارات إلدم لتحديد العدوى المزمنة 
وتطعيم الأشخاص المقربين من الناس المصابين تعد فعالة من حيث التكلفة. 

وف oyal!‏ ساعد النموذج على تصميم سياسة تطعيم للأطفال والمراهقين. وقد تمت 
مقارنة هذه السياسة مع مستويات التغطية الحالية للتطعيم ضد الالتهاب الكبدي 8. وقد 
انتهت إلى أنه عندما يتم تطعيم الأفراد دون سن Ale M‏ فإن ذلك سيؤدي إلى تحسين 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ولك 


الفصل السادس 


النتائج الصحية على المدى الطويل. وف الواقع فإن هذه السياسة كانت فاعليتها من حيث 
التكلفة المالية أكثر من فاعلية السياسة الحالية بمكافحة امرض في مكان ما في وقت التقييم. 
أسئلة للمناقشة: 
-١‏ وضح ما تتميز به طرق OR‏ مثل المحاكاة على طرق التجارب السريرية في تحديد 
أفضل قياس للسيطرة على الالتهاب الكبدي B‏ 
-Y‏ ما هي الطرق التي يوفر بها القرار ونموذج ماركوف Markov‏ وسائل فعالة من 
حيث التكلفة بمكافحة المرض؟ 
-Y‏ ناقش كيف تكون الخلفية متعددة التخصصات أصلًا في إيجاد حل للمشكلة 
الموضحة في القضية. ١‏ 
-٤‏ إلى جانب الرعاية الصحية» اذكر في أي مجال يمكن لمثل هذا النهج النمطي أن 
يساعد في تقليل التكلفة. 
Source: Adapted from Hutton, D. W., Brandeau, M. L., & So, S. K. (2011). Doing good with‏ 
good OR: Supporting cost-effective Hepatitis B interventions. Interfaces, 41(3), 289300-.‏ 
مزايا المحاكاة: 
تستخدم المحاكاة في نمذجة دعم القرار للأسباب التالية: 
- تعد هذه النظرية واضحة إلى حد ما. 
- من الممكن تحقيق قدر كبير من ضغط الوقتء مما هنح المدير الشعور سريعًا ببعض التأثيرات 
للعديد من السياسات على المدى الطويل Vo)‏ إلى ١٠سنوات).‏ 
- تعد المحاكاة وصفية وليست معيارية. وهذا يسمح للمدير بطرح أسئلة ”ماذا - لو“. كما مكن 
للمدير استخدام نهج التجربة والخطأ لحل المشاكلء كما هكن أن يفعل ذلك بشكل أسرع 
وعلى حساب BÍ‏ وبدقة cas]‏ بأقل bl‏ 
- كما يمكن للمدرب أن يقوم بالتجريب من أجل تحديد متغيرات القرار وأي أجزاء من البيئة 
dago‏ بالفعل» ومع بدائل مختلفة. 
- يتطلب نموذج المحاكاة الدقيقة معرفة وثيقة با لمشكلةء مما يجبر مصمم النموذج على التفاعل 
باستمرار مع المدير. وهذا الأمر مطلوب من أجل تطوير أنظمة دعم القرار YS OS‏ من المطور 
واطدير يكتسبان Ga‏ أفضل للمشكلةء وللقرارات المحتملة المتاحة. 
- يتم تصميم النموذج من منظور المدير. 


ONE‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


- يُصمم نموذج المحاكاة من أجل مشكلة معينة وغالبًا لا هكن حل أي مشكلة أخرى. وبالتاليء لا 
يحتاج المدير إلى أي فهم JS ON tele‏ مكون في النموذج يتوافق مع جزء من النظام الحقيقي. 

- هكن للمحاكاة التعامل مع مجموعة كبيرة Hor‏ من أنواع المشاكلء مثل: المخزون» والموظفين» 
بالإضافة إلى الوظائف الإدارية عالية المستوى: مثل: التخطيط بعيد المدى. 

- من الممكن أن تتضمن اب محاكاة بشكل عام التعقيدات الحقيقية للمشاكل؛ فالتبسيط ليس ضروريًا. 
وعلى سبيل JELI‏ قد تستخدم المحاكاة توزيعات احتمالية حقيقية بدلا من توزيعات نظرية تقريبية. 

- تنتج المحاكاة العديد من مقاييس الأداء المهمة تلقائيًا. 

Ul -‏ ما تكون المحاكاة هي oL LI‏ الوحيد لنمذجة أنظمة دعم القرار والتي يمكنها التعامل 
بسهولة مع المشاكل غير المنظمة نسبيًا. 

- وتتوفر بعض حزم المحاكاة سهلة الاستخدام Geus‏ (مثل: محاكاة مونت كارلو (Monte Carlo‏ 
وهي بالإضافة إلى اشتمالها على حزم جداول البيانات (مثل: (GRISK‏ فإنها تتضمن táj‏ 
التأثير على برمجيات الرسم البيانيء وحزم جافا Java‏ (وغيرها من تطورات الويب)» وسوف تتم 
مناقشة أنظمة المحاكاة التفاعلية المرئية في وقت قريب. 


عيوب المحاكاة: 
تتمثل العيوب الرئيسة للمحاكاة فيما يلي: 

- لا يمكن ضمان الحل الأمثلء لكن بشكل عام توجد حلول جيدة نسبيًا. 

- قد تكون عملية تصميم نموذج المحاكاة بطيئة ومكلفةء في حين أن أنظمة النمذجة الحديثة 
أسهل في الاستخدام من أي وقت مضى. 

Éole -‏ ما تكون الحلول والاستدلالات من دراسة المحاكاة غير قابلة للتحويل إلى مشاكل أخرى 
نظرًا لأن النموذج يتناول عوامل مشكلة فريدة من نوعها. 

- أحيانًا يكون من السهل شرح المحاكاة للمديرين في حين أن الطرق التحليلية UIS‏ ما يتم تجاهلها. 

- في بعض الأحيان تتطلب برامج المحاكاة مهارات خاصة بسبب تعقيد طريقة الحل الرسمي. 


منهجية المحاكاة: 


تنطوي المحاكاة على وضع تموذج لنظام حقيقي وإجراء تجارب متكررة عليه. 
أما منهجية المحاكاة فإنها تتكون من الخطوات التاليةء كما هو موضح في الشكل Y)‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 0^0 


الفصل السادس 


-١‏ تحديد المشكلة: علينا دراسة وتصنيف امش كلة الواقعيةء ثم نحدد لماذا يعد نهج المحاكاة 
مناسبًا. وهنا يتم التعامل مع حدود النظام والبيئة وغيرها من جوانب توضيح المشكلة. 

-Y‏ بناء نموذج المحاكاة: وتنطوي هذه الخطوة على تحديد التغيرات وعلاقاتها فضلًا عن جمع البيانات. 
وغالبًا ما يتم وصف العملية باستخدام مخطط انسياي» ومن ثم تتم كتابة برنامج حاسب. 

-Y‏ اختبار النموذج والتحقق من صحته: ينبغي أن يكون نموذج المحاكاة Nas‏ للنظام الجاري 
دراسته بشكل cuoco‏ ولابد من اختبار ذلك والتحقق من صحته. 

-E‏ تصميم التجربة: عند التأكد من صحة التموذج» يكون بذلك قد تم 5 تصميم التجربة. ولابد من 
تحديد مدة تشغيل المحاكاة إذ إنها تعد جزءًا من هذه الخطوة. وهناك نوعان من الأهداف 
المهمة والمتناقضة وهما: الدقة والتكلفة. ومن الحكمة LÍ‏ تحديد الحالات النموذجية (مثل: 
المتوسط والوسيط للمتغيرات العشوائية)» والحالات الأفضل (مثل: التكلفة المنخفضة. والربح 
المرتفع)» بالإضافة إلى أسوأ حالة من السيناريوهات (مثل: التكلفة المرتفعة» والإيرادات 
ا منخفضة)؛ حيث يساعد ذلك في إنشاء نطاقات متغيرات القرار والبيئة التي تعمل فيها كما 
يساعد أيضًا في تصحيح نموذج المحاكاة. 

0- إجراء التجربة: ويقتضي إجراء التجربة مسائل تتراوح من إنشاء الأرقام العشوائية yog‏ إلى عرض النتائج. 

1- تقييم النتائج: ينبغي تفسير النتائج. بالإضافة إلى الأدوات الإحصائية القياسيةء كما هكن أيضًا 
استخدام تحليلات الحساسية. 

۷ تنفيذ النتائج: إن تنفيذ المحاكاة alia‏ مثل أي تنفيذ آخرء فهو يتضمن نفس المشاكل التي 
يتضمنها أي تنفيذ آخر. ومع «US‏ فإن فرص النجاح في المحاكاة تكون أفضل نظرًا لأن المدير 
bole‏ ما يكون مشاركًا في عملية المحاكاة أكثر من النماذج الأخرى؛ حيث تؤدي ا مستويات 
العليا من المشاركة الإدارية بشكل عام إلى مستويات أعلى من نجاح التنفيذ. 
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التحليلات التوجيهية: التحسين والمحاكاة 


وقد قدم كل من Banks‏ و(2009) Gibson‏ بعض النصائح المفيدة حول ممارسات المحاكاة؛ حيث 
قاموا على سبيل JEL‏ بسرد المشاكل السبعة التالية باعتبارها الأخطاء الشائعة التي يرتكبها مصممو 
تماذج المحاكاة. كما توفر القائمة, وإن لم تكن شاملة اتجاهات عامة لمحترفي العمل مشاريع المحاكاة. 
- التركيز على النموذج أكثر من التركيز على المشكلة. 
- توفير تقديرات للنقطة. 
- عدم معرفة وقت التوقف. 
- إعداد تقرير le‏ يريد العميل سماعه وليس با تقوله نتائج النموذج. 
- عدم فهم الإحصاءات. 
- الخلط بين السبب والنتيجة. 
- الفشل في مطابقة الواقع. 

ds‏ مقال متابع» يتابع كل من Banks‏ و(2009) Gibson‏ بتقديم مبادئ توجيهية إضافية 
ينبغي الرجوع إليها في هذا المقال: 
analytics-magazine.org/spring-2009/205-software-solutions-the-abcs-of-‏ 


simulationpractice.html. 


أنواع المحاكاة: 
وكما dul‏ فإنه عندما تكون الدراسات التجريبية وتجريب الأنظمة الحقيقية باهظة الثمن أو 
مستحيلة في بعض الأحيان» فإنه يتم استخدام المحاكاة والنمذجة؛ حيث تسمح UJ‏ نماذج المحاكاة 
بالتحقق من مختلف السيناريوهات المثيرة للاهتمام قبل القيام بأي استثمار. وعمليات المحاكاة 
في الواقع» يتم فيها تعبين العمليات التي تحدث في العام الحقيقي في نموذج ال محاكاة حيث يتكون 
النموذج من علاقات» وبالتالي معادلات تقدم جميعًا عمليات العام الحقيقي. وتعتمد نتائج 
نموذج المحاكاة في هذه الحالة على مجموعة من المَعُْلمات المعطاة للنموذج كمدخلات. 
وهناك العديد من نماذج المحاكاة مثل: محاكاة مونت كارلو Monte Carlo‏ أو نموذج 
الأحداث المنفصلةء أو نموذج العوامل القائمة, أو نموذج ديناميات النظام. ويُعد مستوى التجريد 
في المشكلة هو أحد العوامل التي تحدد نوع تقنية المحاكاة. وعادةً ما ُستخدم نماذج الأحداث 
المنفصلة والنماذج المعتمدة على العوامل طمستويات التجريد الوسطى أو المنخفضة. وبالإضافة إلى 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري OAV‏ 


الفصل السادس 


ذلك فإنه bole‏ ما يؤخذ في الاعتبار العناصر الفردية مثل الأشخاص والأجزاء والمنتجات في نماذج 
المحاكاةء في حين أن ديناميات الأنظمة أكثر ملاءمة للتحليل الكلي. 
وسوف نقدم في القسم التالي» الأنواع الرئيسة من المحاكاة. وهي: المحاكاة الاحتماليةء وا محاكاة 
المعتمدة على الوقت والمستقلة عن الزمن» بالإضافة إلى المحاكأة المرئية. كما أن هناك العديد من 
تقنيات المحاكاة الأخرى مثل نمذجة ديناميات النظام» والنماذج القائمة على الوكيل. وكما ذكرنا آنقاه 
فإن الهدف هنا هو تمكينك من إدراك إمكانات بعض هذه التقنيات بدلا من جعلك oo‏ في استخدامها. 
المحاكاة الاحتمالية: في المحاكاة الاحتماليةء يكون هناك واحد أو أكثر من المتغيرات ا لمستقلة 
(مثل: الطلب في مشكلة جرد) هي الاحتمالية. وهذه المتغيرات تتبع توزيعات احتمالية معينة, 
والتي قد تكون إما توزيعات منفصلة أو مستمرة: 
- التوزيعات المنفصلة: وتنطوي على حالة مع عدد محدود من الأحداث (أو المتغيرات) والتي قد 
تأخذ عددًا محدودًا فقط من القيم. 
- التوزيعات المستمرة: وهي حالات ذات عدد غير محدود من الأحداث الحتملة والتي تتبع 
وظائف AESI‏ مثل التوزيع الطبيعي. 
ويعرض الجدول )0-1( MS‏ نوعي التوزيعات. 
جدول -0: التوزيعات المنفصلة مقابل الاحتمالية المستمرة 
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ا محاكاة المعتمدة على الوقت في مقابل المحاكاة المستقلة عن الوقت: يشير مصطلح الزمن 
المستقل إلى حالة لا يهم فيها معرفة وقت وقوع الحدث بالضبط. فعلى سبيل JULI‏ قد يكون 
لدينا ele‏ أن الطلب على منتج معين عبارة عن ثلاث وحدات في اليوم غير Ul‏ لا نهتم متى يتم 


OMA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


طلب العنصر خلال اليوم. وفي بعض الحالات» قد لا يكون الوقت ole‏ في المحاكاة على الإطلاق» 
كما هو الحال عند تصميم التحكم في المصانع بطريقة Aub‏ ومع ذلكء فإنه في مشاكل خط 
الانتظار التي تنطبق على التجارة الإلكترونيةء من الضروري معرفة الوقت الدقيق للوصول (لمعرفة 
ما إذا كان العميل سيضطر إلى الانتظار). وهذا الموقف ينطبق على الوقت المحدد. 


محاكاة مونت كارلو :Monte Carlo‏ 

bole‏ ما يتم استخدام أحد النوعين التاليين من المحاكاة الاحتماليةء في معظم مشاكل القرارات 
التجارية. وتّعد محاكاة مونت كارلو هى طريقة المحاكاة الأكثر شيوعًا لمشاكل قرارات العمل. las‏ 
هذه الطريقة Éole‏ بتصميم نموذج للمشكلة القرار دون الحاجة إلى أخذ عدم التأكد في الاعتبار لأي 
متغيرات» ثم ندرك أن هناك مَعْلمات أو متغيرات معينة تكون غير مؤكدة أو تتبع توزيع احتمالية 
مفترض أو تقديري» ويعتمد هذا التقدير على تحليل البيانات السابقةء وعندئذ نبدأ بتشغيل تجارب 
أخذ العينات. وتتكون تجارب أخذ العينات الجارية من إنشاء قيم عشوائية من المغلمات غير المؤكدة 
ومن ثم قيم الحوسبة للمتغيرات التي تتأثر Jie‏ هذه oladi‏ أو المتغيرات؛ حيث تصل هذه التجارب 
الخاصة بأخذ العينات بشكل أسامي إلى حل نفس النموذج مثات أو آلاف المرات. وبعد ذلك يمكننا 
تحليل سلوك هذه المتغيرات التابعة أو متغيرات الأداء من خلال دراسة التوزيعات الإحصائية الخاصة 
بهم. وقد استخدمت هذه الطريقة في محاكاة النظم الفيزيائية وكذلك نظم الأعمال. ويوفر موقع 
(http://www.palisade.com/risk/monte carlo simulation.asp) Palisade.com‏ برنامجًا 
تعليميًا عامًا وجيدًا لطريقة محاكاة مونت كارلو. كما يقوم الموقع بتسويق أداة تسمى RISK‏ وهي 
عبارة عن برنامج محاكاة شائع يعتمد على جداول بيانات مونت كارلو. كما يوجد برنامج آخر شائع في 
هذه الفئة وهو «Crystal Ball‏ والذي يتم تسويقه Jlo‏ بواسطة -Oracle as Oracle Crystal Ball‏ 
وبالطبع» فإنه يمكن Us‏ إنشاء تجارب Casa‏ كارلو وتشغيلها في جدول بيانات Excel‏ دون استخدام 
أي برنامج إضافي مثل البرنامجَين اللدّين ذكرا ÉT‏ غير أن هذه الأدوات تجعله أكثر ملاءمة لتشغيل 
مثل هذه التجارب في النماذج القائمة على Excel‏ الجدير بالذكر أن نماذج محاكاة مونت كارلو قد 
تم استخدامها في العديد من التطبيقات التجارية. ومن الأمثلة على ذلك استخدام شركة بروكتور 
وجامبل (Procter & Gamble)‏ لهذه النماذج لتحديد مخاطر الصرف الأجنبي؛ واستخدام شركة 
Lilly‏ للنموذج لتحديد القدرة النباتية المثلى؛ وكذلك شركة أبو ظبي للمياه والكهرباء والتي استخدمت 
@Risk‏ للتنبؤ بالطلب على المياه في أبو ظبي؛ بالإضافة إلى الآلاف من دراسات حالات واقعية أخرى. 
ويشتمل كل موقع من مواقع شركات برامج المحاكاة على العديد من قصص النجاح. 
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محاكاة الحدث المنفصل: 
تشير محاكاة الحدث المنفصل إلى بناء نموذج لنظام يتم فيه دراسة التفاعل بين الكيانات 
المختلفة. وأبسط مثال على ذلك هو مثال المتجر الذي يتألف من خادم وعملاء. وهكننا تقدير 
متوسط hof‏ النظام» ووقت الانتظارء وعدد العملاء المنتظرين» وما إلى ذلكء من خلال نمذجة 
العملاء الذين يصلون إلى معدلات مختلفةء والخادم الذي يخدم بمعدلات مختلفة. ومثل هذه 
الأنظمة يتم النظر إليها باعتبارها مجموع ات من العملاء وقوائم انتظارء وخوادم. كما يوجد 
الآلاف من التطبيقات الموثقة لنماذج محاكاة الأحداث المنفصلة في الهندسة. والأعمال التجارية, 
وما إلى ذلك. وقد كانت أدوات بناء نماذج محاكاة الحدث المنفصلة موجودة منذ فترة طويلة» غير 
أنها تطورت للاستفادة من التطورات في القدرات الرسومية لبناء وفهم نتائج مثل هذه النماذج 
للمحاكاة. وفي القسم JLI‏ سوف نناقش هذه الطريقة الخاصة بالنمذجة. وتعرض الحالة العملية 
(A-1)‏ مثالا على استخدام هذه المحاكاة في تحليل تعقيدات سلسلة التوريد التي تستخدم محاكاة 
مرئية والتي سيتم وصفها في القسم التالي. 
حالة عملية AA‏ 
استخدام شركة كوزان (Cosan)‏ ا محاكاة من أجل تحسين سلسلة التوريد للطاقة 
Cosan‏ هي مجموعة شركات مقرها البرازيل وتعمل على مستوى sell]‏ وأحد 
أنشطتها الرئيسة هي زراعة ومعالجة قصب السكر. وقد أصبح قصب السكر الآن 
مصدرًا LZ)‏ للإيثانولء فضلًا عن أنه المصدر الرئيس للسكرء كما أنه مكون رئيس في 
الطاقة المتجددة. وقد أصبح الإيثانول Élis‏ كبا لشركة Cosan‏ بسبب تزايد الطلب 
على الطاقة المتجددة. حيث يقوم الإيثانول الآن بتشغيل مصفاتين بالإضافة إلى M‏ 
مصنع إنتاج» وملايين الهكتارات hectares‏ من مزارع قصب السكر. ووفقًا للبيانات 
الحديثة فقد عالجت الشركة أكثر من EE‏ مليون طن من قصب السكر, كما أنتجت أكثر 
من VY‏ مليار لتر من الإيثانول» بالإضافة إلى Y,Y‏ مليون طن من السكر. وكما يتبينء OB‏ 
عمليات هذا النطاق تؤدي إلى سلاسل التوريد المعقدة. ولذلك؛ فقد callo‏ من فريق 
الإمدادات تقديم توصيات إلى الإدارة العليا من أجل: 
- تحديد العدد الأمثل من الشاحنات المطلوبة في أسطول يُستخدم لنقل قصب 
لسكر إلى معامل التصنيع من أجل الحفاظ على رأس المال. 
- تقديم اقتراح لكيفية زيادة قدرة قصب السكر الفعلية التي يتم إمداد مصانع السكر بها. 
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- تحديد مشاكل عنق الزجاجة المتعلقة بالإنتاج لوضع حلول لها من أجل تحسين 
تدفق قصب السكر. 

doll‏ / الحل: 

قام فريق الإمدادات بالعمل من خلال برمجيات Simio‏ ومن e$‏ قام الفريق ببناء 
تموذج محاكاة مركب لسلسلة توريد شركة Cosan‏ فيما يتعلق بهذه المشاكل. وتبعًا 
للموجز الذي قدمته برمجيات Simio‏ فإنه: ”على مدار ثلاثة أشهرء قام المهندسون 
المستأجرون حديثًا بجمع البيانات المتعلقة بهذا ا مجالء كما تلقوا تدريبًا las‏ ومساعدة 
في النمذجة من "Paragon Consulting of San Palo‏ 

ولنمذجة العمليات الزراعية لتحليل رحلة ما بعد حصاد قصب السكر حتى يصل 
إلى مصانع cell‏ فقد شملت أهداف النموذج تفاصيل الأسطول الناقل لقصب السكر 
عبر الطرق إلى Unity Costa Pinto‏ كما شملت Lj]‏ القدرة الفعلية لاستقبال مصانع 
سكر القصبء والاختناقات. بالإضافة إلى نقاط التحسين في تدفق CCT‏ (قطع التنزيل) 
من قصب السكرء وهكذا. وتتمثل مَعْلمات النموذج فيما يلي: 

- متغيرات المدخلات: DV‏ 





- متغيرات الإنتاج: Y‏ 

- المتغيرات الإضافية: AY.‏ 

- كيانات متغيرة: ۸. 

- جداول المدخلات: 19. 

- أيام المحاكاة: 76٠‏ (الموسم الأول). 

- عدد الكيانات: ٠١( ١7‏ أنواع مركبة حصاد لنقل قصب السكر). 

النتائج / الفوائد: 

وقد قدمت هذه التحليلات التي نتجت عن نماذج Simio‏ فكرة جيدة عن خطر 
التشغيل خلال فترة Gg YE‏ بسبب الشكوك المختلفة. وقد تمكنت الشركة من اتخاذ 
قرارات أفضل وتوفير أكثر من 80٠٠,٠٠١‏ من هذه الجهود الخاصة بالنمذجة وحدها 
فقطء من خلال تحليل الاختناقات المختلفة وطرق التخفيف من هذه السيناريوهات. 

-١‏ ما نوع الاضطرابات في سلسلة التوريد التي هكن أن تحدث في نقل قصب السكر 
من الحقل إلى مصانع الإنتاج لتطوير السكر والإيثانول؟ i‏ 
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-Y‏ ما هي الأنواع المتقدمة من التخطيط والتنبؤ التي قد تكون مفيدة في تخفيف 
مثل هذا الاضطراب؟ 

ما الذي يمكن أن نتعلمه من هذه الحالة العملية؟ 

هذه القصة القصيرة للحالة العملية التي نحن بصددها توضح قيمة تطبيق المحاكاة 
على أحد المشاكل والتي قد يصعب معها بناء نموذج التحسين. ومن خلال دمج نموذج 
محاكاة الحدث المنفرد والمحاكاة التفاعلية المرئية (VIS)‏ يممكن تصور تأثير الانقطاعات 
à‏ سلسلة التوريد بسبب فشل الأسطولء والوقت غير المتوقع في هذا الوضع» وغير ذلك 
ومن تم التوصل إلى التصحيحات المخطط Ag!‏ 
Sources: Compiled from Wikipedia contributors, Cosan, Wikipedia, The Free‏ 
Encyclopedia, https://en.wikipedia.org/w/index.php?title=Cosan&oldid=713298536‏ 
{accessed July 10, 2016); Agricultural Operations Simulation Case Study: Cosan,‏ 
http://www.simio.com/case-studies/Cosan-agricultural-logistics-simulation-‏ 
software-case-study/agricultural-simulation-software- case-study-video-cosan.php,‏ 
(accessed July 2016); Cosan Case Study: Optimizing agricultural logistics operations,‏ 
http://www.simio.com/case-studies/Cosan-agricultural-logistics-simulation-‏ 

software-case-study/index.php, (accessed July 2016). 


أسئلة مراجعة على القسم A71‏ 

-١‏ اذكر خصائص المحاكاة. 

-Y‏ اذكر مزايا وعيوب المحاكاة. 

-Y‏ اذكر مع الشرح خطوات منهجية المحاكاة. 
-٤‏ اذكر مع الشرح أنواع المحاكاة. 


٠١-1‏ المحاكاة التفاعلية المرئية: 


فيما يلي سنقوم بفحص الطرق التي تبن صورة gilo‏ القرار أثناء اتخاذ القرار في العمل. فهو 
يعمل من خلال سيناريوهات لشتى البدائل. حيث تتغلب هذه الطرق القوية على بعض أوجه 
القصور في الطرق التقليدية كما تساعد على بناء الثقة في الحل الذي تم التوصل إليه نظرًا لإمكانية 
تصور هذه الطرق بشكل مباشر. 
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عيوب المحاكاة التقليدية: 

تعد المحاكاة طريقة راسخة ومفيدة. بالإضافة إلى أنها وصفيةء وتعتمد على الرياضيات 
لاكتساب نظرة ثاقبة في حالات اتخاذ القرار المعقدة. وعلى الرغم من كل ما ذكر, إلا أن المحاكاة 
Šole‏ لا تسمح لصانعي القرار برؤية كيفية تطور حل مشكلة معقدة (مضغوطة). بالإضافة إلى أن 
صانعي القرار لا يمكنهم التفاعل مع المحاكاة (والتي ستكون مفيدة لأغراض التدريب والتدريس). 
وبشكل ple‏ فإن المحاكاة تشير إلى النتائج الإحصائية في نهاية مجموعة من التجارب. وبالتالي 
فإن صانعي القرار ليسوا جزءًا مكملا في تطوير المحاكاة والتجريب» ولا يمكن استخدام خبراتهم 
وحكمهم بشكل مباشر. فإذا كانت نتائج المحاكاة لا تتطابق مع حدس أو حكم صانع القرارء فإنه 
من الممكن حدوث فجوة ثقة في النتائج. 
المحاكاة التفاعلية المرئية: 

إن المحاكاة التفاعلية المرئية (VIS)‏ والتي تُعرف Uo]‏ باسم النمذجة التفاعلية المرئية (VIM)‏ 
وحل المشاكل التفاعلي المري» هي طريقة محاكاة تتيح لصانعي القرار رؤية ما يفعله gògail‏ 
وكيف يتفاعل مع القرارات BA‏ حسب ما يتم صنعها. وقد استخدمت هذه التقنية بنجاح 
كبير في تحليل العمليات في عدة مجالات Jio‏ سلسلة التوريد والرعاية الصحيةء حتى يتمكن 
المُستَخدم من توظيف معرفته لتحديد وتجربة إستراتيجيات القرارات المختلفة أثناء التفاعل مع 
النموذج. ومن الممكن حدوث التعلم ا معزز حول مشكلة Sbg‏ البدائل التي تم اختبارها. 

ولعرض تأثير القرارات الإدارية ا مختلفةء فإن ا محاكاة التفاعلية المرئية (VIS)‏ تستخدم شاشات 
الرسوم المتحركة للحاسب؛ حيث تختلف هذه الشاشات عن الرسومات العادية في أنها تنيح 
للمستخدم ضبط عملية guo‏ القرار ورؤية نتائج التدخل. ويُعد النموذج dll‏ رسا Glo‏ يُستخدم 
باعتباره جزءًا لا يتجزأ من عملية صنع القرار أو حل المشاكلء وليس مجرد جهاز اتصال فقطء حيث 
يستجيب بعض الأشخاص للعروض الرسومية بشكل أفضل من غيرهم. كما يستطيع هذا النوع من 
التفاعل مساعدة المديرين في دراسة موقف اتخاذ القرار. 

ويمكن للمحاكاة التفاعلية المرئية (VIS)‏ أن توضح أنظمة ثابتة أو حركية؛ حيث تعرض النماذج 
الثابنة صورة مرئية لنتيجة بديل واحد في كل مرة. أما النماذج الحركية فإنها تعرض الأنظمة التي 
تتطور مع مرور الوقت» ويتم توضيح التطور عن طريق الرسوم المتحركة. وقد ارتبطت أحدث 
تقنيات المحاكاة المرئية بمفهوم الواقع الافتراضيء حيث يتم إنشاء عام اصطناعي لأغراض متعددة 
من التدريب إلى الترفيه إلى عرض البيانات في مشهد اصطناعي. فعلى سبيل «JUL‏ يقوم الجيش 
الأمريكي باستخدام أنظمة VIS‏ حتى تتمكن القوات البرية من الإلمام بالتضاريس أو المدينة من أجل 
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توجيه نفسها بسرعة كبيرة. كما يستخدم الطيارون VIS‏ من أجل التعرف على الأهداف من خلال 
محاكاة عمليات الهجوم. وبالإضافة إلى US‏ فإن برنامج VIS‏ قد يتضمن Lal‏ إحداثيات 615. 
النماذج التفاعلية المرئية و1055: 

استخدمت النماذج التفاعلية المرئية في أنظمة دعم القرار في العديد من قرارات إدارة 
العمليات. وتتكون الطريقة من تحضير (مثل تحضير مضخة مياه) نموذج تفاعلي gab doa‏ (أو 
شركة) بوضعه الحالي» ومن تم يعمل النموذج بسرعة على الحاسبء مما يسمح للمديرين بمراقبة 
احتمالات AS‏ عمل المصنع في المستقبل. 

Ísle هو إدارة خط الانتظار (الطابور).‎ (VIM) على النماذج التفاعلية المرئية‎ Jlis s 
ما يقوم برنامج مثل أنظمة دعم القرار بحساب عدة مقاييس لأداء بدائل القرار المختلفة (مثل:‎ 
وقت الانتظار في النظام). تتطلب مشاكل الطابور استخدام المحاكاة؛ حيث هكن للنماذج‎ 
عند تشغيل المحاكاة عرض حجم الطابور أثناء تغييره كما يمكنها أيضًا‎ (VIM) التفاعلية المرئية‎ 
تقديم إجابات بيانية حول ما إذا كانت الأسئلة تتعلق بالتغيرات التي تحدث في متغيرات الإدخال.‎ 
مثالا محاكاة مرئية استُخدمت بغرض استكشاف تطبيقات تقنية‎ (A7) وتقدم الحالة العملية‎ 
إعداد التصنيع.‎ (RFID) تحديد ترددات الراديو‎ 

كما هكن Léi‏ دمج تقنيتي النماذج التفاعلية المرئية والذكاء الاصطناعي؛ حيث يضيف دمج 
كلا التقنيتين Bae‏ قدرات تتراوح من القدرة على بناء الأنظمة بيانيًا إلى التعلم عن ديناميكيات 
النظام. فهذه الأنظمة - لاسيما تلك التي تم تطويرها للعسكرية وصناعة ألعاب الفيديو - لديها 
أساليب تفكير تجعلها قادرة على التصرف بمستوى ذكاء dle‏ نسبيًا في تفاعلاتها مع المستخدمين. 


حالة عملية 9-5 
تحسين قرارات جدولة محل العمل من خلال الترددات اللاسلكية RFID‏ التقييم 
القائم على المحاكاة 


يسعى مزود خدمات التصنيع الخاص بالمكونات البصرية والكهروميكانيكية المعقدة 
إلى اكتساب الكفاءة في قرار الجدولة الخاص محل عمله نظرًا لمعاناة عمليات المتجر 
الحالية من بعض المشاكل: 

- عدم وجود نظام للتسجيل في حالة وصول pols‏ عملية (WIP) workin‏ فعليًا 
إلى محطات العمل أو عند مغادرتها محطات تشغيل العمل بالإضافة إلى مدة «là;‏ 
25 الفعلية في كل محطة عمل. 

- عدم قدرة النظام الحالي على مراقبة أو متابعة حركة كل WIP‏ في خط الإنتاج بشكل فوري. 
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ونتيجة لذلكء فإن الشركة تواجه مش كلتين رئيستين في هذا الخط الإنتاجي» وهي: 
مشكلة التراكمات المرتفعة ومشكلة تكاليف ارتفاع العمل الإضافي لتلبية الطلب. 
وبالإضافة إلى «DS‏ فإن المنبع لا يمكنه الاستجابة بسرعة كافية للحوادث غير المتوقعة 
مثل التغيرات في الطلب أو نقص المواد. كما أنه لا يمكنه مراجعة الجداول بطريقة فعالة 
من حيث التكلفة. وتقوم الشركة بدراسة تنفيذ RFID‏ على خط الإنتاج. غير أنها 
بالرغم من ذلكء لا تعرف ما إذا كانت ستتحمل هذه النفقات الرئيسة من أجل إضافة 
رقائق RFID‏ على صناديق الإنتاج» وتثبيت RFID OGG‏ في جميع slol‏ خط الإنتاج» 
وبالتالي JS‏ تأكيد ستؤدي أنظمة معالجة هذه المعلومات إلى عدة مكاسب حقيقية. 
ولذلك؛ فإن هناك سؤالًا lol‏ وهو لاستكشاف أي التغيرات الجديدة في جدولة الإنتاج 
التي من المحتمل أن gå‏ عن الاستثمار في بنية RFID‏ التحتية. 

Hay el 

نظرًا لأن استكشاف إدخال أي نظام جديد في نظام الإنتاج المادي من الممكن أن 
يكون مكلقًا للغاية أو حتى Lios‏ فقد تم تطوير نموذج محاكاة للحدث منفصل 
لفحص كيف يستطيع التعقب (tracking)‏ والتتبع من خلال RFID‏ أن يقوم بتسهيل 
أنشطة جدولة إنتاج ورشة العمل. وقد تم اقتراح قاعدة جدولة VBS‏ تعتمد على الرؤية 
وتستخدم أنظمة التتبع الفورية لتعقب أجزاء ومكونات -WIPs‏ بالإضافة إلى المواد الخام 
في عمليات الورش (shop-floor)‏ .439 تم تطبيق نهج المحاكاة من أجل فحص فائدة 
قاعدة 1785 مقابل قواعد الجدولة الكلاسيكية: الأسبق في بدايات وأقدم قواعد موعد 
الاستحقاق. وقد تم استخدام برامج SIMIO‏ لتطوير تموذج المحاكاة. وبرامج SIMIO‏ 
هي عبارة عن مجموعة من برامج محاكاة النماذج ثلاثية الأبعاد والتي تستخدم أسلوبًا 
Gago‏ نحو النمذجةء وقد تم استخدام هذه البرامج Bago‏ في العديد من المجالات مثل 
المصانع وسلاسل التوريد والرعاية الصحية والمطارات وأنظمة الخدمات. 

ويعرض الشكل (Y-Y)‏ لقطة شاشة من لوحة واجهة SIMIO‏ لهذا الخط الإنتاجي. 
حيث تتضمن تقديرات colli‏ ا ممستخدمة للحالة الأولية في نموذج المحاكاة كلا من 
الطلبات والتوقعات الأسبوعية بالإضافة إلى تدفق العمليةء وعدد محطات العمل وعدد 
مشغلي الطوابقء ووقت التشغيل في كل محطة das‏ وبالإضافة إلى ذلك فإنه يتم 
تقدير ollas‏ بعض بيانات الإدخال مثل وقت وضع علامات RFID‏ أو وقت استرجاع 
ال معلوماتء أو وقت تحديث النظام من خلال دراسة تجريبية ومن خبراء الموضوع. 
ويوضح الشكل )١5-5(‏ الرؤية العملية لنموذج المحاكاة حيث يتم تنفيذ أوامر محاكاة 
محددة وترميزها. كما يقدم كلا الشكلين )107( و(17-5) عرضًا للتقرير القياسي 
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وتقرير الشبكة المحورية لنموذج المحاكاة. حيث يوفر كل من التقرير القياسي وشكل 
الشبكة المحورية dia yo‏ سريعة جدًا للعثور على نتائج إحصائية محددة: ا متوسط 
أو النسبة المئوية» أو الإجماليء أو الحد الآقصىء أو الحد الأدنى لقيم المتغيرات التي تم 
تعيينها والتقاطها كمخرج من نموذج المحاكاة. 






































شكل 16-5: عرض عملية نموذج المحاكاة 
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شكل 15-5: تقرير شبكة محورية من تشغيل SIMIO‏ 


تشير نتائج المحاكاة إلى أن الأداء الذي eis‏ عن قاعدة الجدولة المعتمدة على RFID‏ 
يعد أفضل إذا ما قورن بقواعد الجدولة التقليدية فيما يتعلق بوقت المعالجة, ووقت 
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الإنتاج» واستخدام ا مواردء والتراكم والإنتاجية. فإن الشركة هكنها أخذ هذه المكاسب 
الإنتاجية ومن e‏ تقوم بتحليل التكلفة / الفائدة في اتخاذ قرارات الاستثمار النهائية. 





د 


أسئلة للمناقشة: 

١-ما‏ هي الأساليب الأخرى التي يمكن اتخاذها لتحليل قرارات الاستثمار في الحالات 
التى تشبه هذه الحالة؟ 

-Y‏ كيف هكن توفير الوقت في حالة قدرة رقاقة RFID‏ على معرفة الموقع الدقيق 
للمنتج قيد التشغيل؟ 

-Y‏ ابحث لتتعرف على تطبيقات أجهزة استشعار REID‏ في أماكن أخرى. مع 
توضيح أي منها تجده أكثر إثارة للاهتمام. 
Source: Based on Chongwatpol, J., & Sharda, R. (2013). RFID-enabled track and‏ 


traceability in job-shop scheduling environment. European Journal of Operational 


Research, 227(3), 453- 463, http://dx.doi.org/10.1016/j.ejor.2013.01.009. 

برامج المحاكاة: 

هناك المئات من حزم المحاكاة التي تتوفر لمجموعة من حالات اتخاذ القرار المتنوعة» حيث 
يتم تشغيل الكثير منها كنظم على شبكة الإنترنت. وتقوم ORMS Today‏ بنشر مراجعة دورية 
لبرامج اللحاكاة. وأحد هذه المراجعات الحديثة (اعتبارًا من أكتوبر )7١١0‏ متاح عبر orms-‏ 
today.org/surveys/Simulation/Simulation.html‏ (تمت الزيارة في يوليو (Y YA‏ وتتضمن 
حزم برامج الحاسب كلا من: 
«(Lumina Decision Systems, lumina.com) Analytica -‏ 


Oracle as Oracle Crystal Ball, (والتي تباع الآن من قبل‎ Excel add-ins Crystal Ball - 


.(oracle.com 

.(Palisade Corp., palisade.com) (RISK - 

(soldby Rockwell Intl., arenasimulation.com) Arena -‏ وهو برنامج تجاري كبير لمحاكاة 
الأحداث المنفصلة. 

(simio.com) Simio -‏ وهو برنامج للمحاكاة التفاعلية المرئية (VIS)‏ سهل الاستخدام تم 
تطويره من JŠ‏ مطوري برنامج Arena‏ الأصليين. وبالإضافة إلى ذلك فهناك: 
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(extendsim.com) ExtendSim -‏ وهو برنامج محاكاة تفاعلية مرئية (VIS)‏ آخر متميز كما 
أن له شهرة واسعة. 

JMP -‏ وتمتلكه SAS‏ وهو عبارة عن حزمة برمجية تحليلية رسومية تنطوي Ul‏ على ا محاكاة كأحد مكوناتها. 

وللحصول على معلومات حول برامج ال محاكاة يمكنك مراجعة مجتمع النمذجة والمحاكاة 

الدولية (scs.org)‏ ومسح البرنامج السنوي في ormstoday.com) ORMS Today‏ 

أسئلة مراجعة على القسم :٠١-١‏ 

-١‏ عرف المحاكاة المرئية مع المقارنة بينها وبين المحاكاة العادية. 

(VIM (أي: النمذجة التفاعلية المرئية‎ (VIS) قم بوصف مميزات المحاكاة التفاعلية المرئية‎ -Y 

التي تجعلها جذابة لصناع القرار. 

-Y‏ كيف هكن استخدام المحاكاة التفاعلية المرئية (VIS)‏ في إدارة العمليات؟ 

SVIS كيف يشبه فيلم الرسوم المتحركة تطبيق‎ -E 

تلخيص لأهم نقاط الفصل: 

- تلعب النماذج - متعددة الأنواع - دورًا رئيس ا في أنظمة دعم القرار لأنها ُستخدم لوصف 
مواقف حقيقية لصنع القرار. 

- يمكن أن تكون النماذج ثابتة (sl)‏ لقطة مفردة لموقف ما) أو متحركة (أي فترة متعددة). 

- يتم إجراء التحليل تحت درجة تأكد مفترضة (والذي يعتبر مقبولًا بنسبة كبيرة) أو الخطر أو 
عدم التأكد (والذي يعتبر مقبولًا بنسبة ضئيلة). 

- يعرض ال مخططات البيانية التأثيرية بيانيًا العلاقات الداخلية لنموذج lo‏ ويمكن استخدامها 
لتعزيز استخدام تقنية جداول البيانات. 

- يوجد لدى جداول البيانات العديد من القدرات» ما في ذلك تحليل ”ماذا - لو“» والبحث عن 
«Baal‏ والبرمجة» وإدارة قواعد البيانات» والوصول للوضع الأمثلء والمحاكاة. 

- يمكن لكل من جداول القرار وأشجار القرار أن تقوم بنمذجة وحل مشاكل بسيطة لصنع القرار. 

- تعتبر الإرمجة الرياضية منهجًا مهما للوصول للوضع الأمثل. 

- تعتبر الإرمجة الخطية هي أكثر طرق البرمجة الرياضية انتشارًا. فهي تحاول تحقيق التخصيص 
الأمثل للموارد المحدودة تحت قيود تنظيمية. 

- تعتبر الأجزاء الرئيسة لنموذج البرمجة الخطية هي دالة الهدفء ومتغيرات القرارء والقيود. 
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- تعتبر حل مشاكل guo‏ القرار متعدد المعايير Gao‏ ولكن ليس مستحيلا. 

- ”ماذا - لو“ و”البحث عن الهدف“ هما أكثر الطرق انتشارًا لتحليل الحساسية. 

- تشتمل العديد من أدوات تطوير أنظمة دعم القرار بداخلها على نماذج كمية (كنماذج مالية أو 
إحصائية) أو يمكنها التعامل بسهولة مع مثل هذه النماذج. 

- تعتبر المحاكاة نهج أنظمة دعم القرار واسع الاستخدام؛ إذ تتضمن تجربة ذات نموذج Ji‏ 
موققًا حقيقيًا gual‏ القرار. 

- يمكن للمحاكاة التعامل مع حالات أكثر تعقيدًا من التحسينء ولكنها لا تضمن حلا أمثل. 

- توجد عدة طرق مختلفة للمحاكاةء ويعد بعضها مهما في اتخاذ القرار ومنها محاكاة مونت كارلو 
ومحاكاة الحدث المنفصل. 

- يسمح VIS/VIM‏ لصانع القرار بالتفاعل المباشر مع أي نموذج ويعرض النتائج بأسلوب سهل الفهم. 




















مصطلحات أساسية: 
التأكد. البحث عن الهدف. | أهداف متعددة. عدم التأكد. 
RIA‏ رقا 
تحليل القرار. المخطط البياني التأثيري. | الحل الأمثل. Ln‏ بل 
i i‏ للتحكم فيه. 
ل القرا خير النتيجة ا متوسط. | مَعْلَمَة ا 
جدول القرار. متغير النتيجة المتوسط. E‏ المرئية (VIM)‏ 
TI‏ ف ا المحاكاة التفاعلية 
شجرة القرار. dean‏ الخطية (CPV‏ | موذج Nes‏ المرئية VIS)‏ 
متغير القرار. البمجة الرياضية. | ران تحليل Ay - BU”‏ 
محاكاة الحدث المنفصل. | محاكاة مونت كارلو. | الخطر. التوقع. 
تحليل متعدد الأبعا 
نماذج متحركة. ERU des! o deut‏ 
(مذجة). 
المسح البيئي والتحليل. | النماذج الثابتة. تحليل الحساسية. ENT‏ 
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أسئلة للمناقشة: 

-١‏ كيف ترتبط التحليلات التوجيهية بكل من التحليلات الوصفية والتنبؤية؟ 

-Y‏ اشرح الاختلافات بين النماذج الثابتة والمتحركة. وكيف هكن استنباط أحدهما من الآخر؟ 

-Y‏ ما هو الفرق بين النهج التفاؤلي والنهج التشاؤمي في صنع القرار تحت درجة عدم التأكد امفترضة؟ 

-E‏ اشرح IU,‏ يتضمن حل المشاكل تحت درجة عدم التأكد أحيانًا افتراض أن المشكلة يجب أن 
يتم حلها تحت شروط الخطر. 

0- يحتمل أن يكون Excel‏ هو برنامج جداول البيانات الأكثر انتشارًا بالنسبة لأجهزة الحاسب 
الشخصيةء SISU‏ وما الذي LSe‏ القيام به مع هذه الحزمة لجعلها جذابة li>‏ لجهود النمذجة؟ 

-١‏ اشرح كيفية عمل أشجار القرار. وكيف هكن حل مشكلة معقدة باستخدام شجرة القرار؟ 

-V‏ اشرح كيف هكن للبرمجة الخطية حل مشاكل التخصيص. 

SLP وعيوب استخدام حزمة جداول البيانات لإنشاء وحل نماذج‎ blja ما هي‎ -A 

SLP وعيوب استخدام حزمة البرمجة الخطية لإنشاء وحل نماذج‎ blja ما هي‎ -A 

-٠‏ ماهو الفرق بين تحليل القرار مع هدف واحد وتحليل القرار مع أهداف متعددة 

(أي المعايير)؟ اشرح الصعوبات التي قد تظهر عند تحليل الأهداف المتعددة. 

-١‏ اشرح عمليًا كيف يمكن ظهور أهداف متعددة. 

-١١‏ قارن بين تحليلي ”ماذا - لو“ و”البحث عن الهدف“. 

-YY‏ قم بوصف العملية العامة للمحاكاة. 

-٤‏ اذكر بعض المزايا الرئيسة للمحاكاة فوق التحسين والعكس. 

BU هكن اعتبار العديد من ألعاب الحاسب محاكاة مرئية» اشرح‎ - YO 

-V1‏ اشرح BU‏ تكون VIS‏ مفيدة بشكل خاص في تنفيذ التوصيات المشتقة من أجهزة الحاسب. 

تمارين - شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 

-١‏ قم teradatauniversitynetwork.com «3L AS ub‏ وحدد كيف يتم استخدام النماذج في 
حالات ذكاء الأعمال والأوراق. 

-Y‏ قم بإنشاء نماذج جداول البيانات المعروضة في الشكلين (Y-I)‏ و(6-5). 
-١‏ ما هو تأثير تغير معدل الفائدة من ۸ إلى >1١‏ في نموذج جدول البيانات المعروض في الشكل E-I)‏ 
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-Y‏ بالنسبة للنموذج الأصلي في الشكل (Y‏ ما هو معدل الفائدة المطلوب لتخفيض الدفعات 
الشهرية بنسبة SAY-‏ وما هو التغير في مبلغ القرض الذي سيكون له نفس التأثير؟ 

-Y‏ في جدول البيانات المعروض في الشكل )671( ما هو تأثير الدفع المقدم هبلغ ٠٠١‏ دولار كل 
شهر؟ ما هو الدفع المقدم الضروري لسداد القرض في Sao Gle YO‏ من "١‏ عامًا؟ 

Excel's Solver التي تم وصفها في هذا الفصلء باستخدام‎ (MBI) قم بحل مشكلة مزيج المنتجات‎ -Y 
Lindo من‎ Lindo حيث يتاح‎ Lindo مثل‎ LP solver أو نسخة الطالب من برنامج‎ 
وكذلك يتوفر غيره - ابحث في الويب. قم باختبار‎ dindo.com على موقع‎ Systems, Inc 
تقارير الحل (المخرجات) للإجابات وتقرير الحساسية. هل حصلت على نفس النتائج المذكورة‎ 
في هذا الفصل؟ جرب تحليل الحساسية المشار إليه في الفصل وهو تخفيض الجانب الأيمن‎ 
dal ماذا يحدث‎ M33 بمقدار وحدة واحدة, أي من ۲۰۰ إلى‎ CC-8 من القيود التسويقية‎ 
(مكن عمل‎ Gle عندما تقوم بحل المشكلة بعد هذا التعديل؟ قم بإزالة قيد 00-8 الأدنى‎ 
أو جعل الحد الأدنى صفرًا) ثم قم بإعادة حل المشكلة. ماذا‎ Solver ذلك بسهولة إما بحذفه في‎ 
حاول تعديل معاملات دالة الهدف وانظر ماذا يحدث.‎ ALI يحدث؟ باستخدام الصيغة‎ 

-E‏ عبر البحث في الويب قم بفحص كيفية استخدام النماذج وحلولها بواسطة إدارة الأمن الوطني 
الأمريكي في ”الحرب ضد الإرهاب“. قم أيضًا بفحص كيفية استخدام الحكومات أو الهيئات 
الحكومية الأخرى للنماذج في مهامها. 

0- هذه المشكلة مساهمة من د. Rick Wilson‏ من جامعة أوكلاهوما الحكومية. 

لقد ضرب الجفاف مؤخرًا المزارعين بشدة. تأكل الأبقار الذرة الحلوة. 

cal‏ مهتم بإعداد خطة تغذية للأسبوع القادم لمواشيك باستخدام سبعة منتجات غذائية 
غير تقليدية وهي: (۱) حبوب شوكولاتة (Y) Lucky Charms‏ أصابع الزبدة. (Y)‏ حليب» 
o (£)‏ كريم فانيلياء )0( حبوب Cap'n Crunch‏ )1( الذرة الحلوة (لأن الذرة الحقيقية 
كلها ميتة)؛ (V)‏ شرائح البسكويت -Ahoy‏ 

















2 , شوكولاتة 
شرائح | الذرة | Lol l| Capn‏ 
شرائح ر p‏ یس كريم Lucky e‏ 
Ahoy‏ | الحلوة | Crunch‏ | فانیلیا Buy] ٠‏ 
Charms‏ 
wo 0,0 ٤ Vo‏ | ملاع ۷ 06 | دولار / رطل 
نعم | لا لا لا نعم | نعم | نعم شوكولاتة 
vo ^ £o 10 vy n w‏ بروتين 
TDN w Y. M 1 M ^ w‏ 
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A‏ شوكولاتة 
شرائح | الذرة | Capn‏ أأيس كريم أصابع شوکو 1 
Ahoy‏ | الحلوة | Crunch‏ | فانيليا ^ | الزبدة n‏ 
Charms‏ 
Y £ £o 1۲ Y ١ o‏ كالسيوم 
وتظهر تكلفة الرطل بالدولارء وكذلك وحدات البروتين لكل رطل تساهم da‏ ومجموع العناصر 





الغذائية المنهضمة (TDN)‏ التي يساهمون بها لكل Jb)‏ ووحدات الكالسيوم لكل Jb)‏ 
cal‏ تقدر أن الكمية الإجمالية من منتجات التغذية غير التقليدية تساهم بالمقادير التالية 
من العناصر الغذائية: ٠٠٠٠١‏ وحدة بروتين على JEU‏ و0١٠2‏ وحدة TDN‏ على الأقلء ومن 
٠‏ على الأقل إلى ٠٠٠١‏ على الأكثر وحدة كالسيوم. 
ويوجد Ul‏ بعض المتطلبات المتنوعة الأخرى: 
- لا يمكن أن تتجاوز الشوكولاتة في خطة التغذية الشاملة (بالرطل) مقدار العناصر الأخرى 
غير الشوكولاتة. ويعرض الجدول السابق ما إذا كان المنتج يعتبر شوكولاتة أم لا (نعم = 
شوكولاتة» لا = ليس شوكولاتة). 
- لا يمكن أن يشكل أي منتج تغذية واحدًا أكثر من YO‏ من الوزن الإجمالي (بالرطل) اللازم 
لإنشاء مزيج تغذية مقبول. 
- هناك نوعان من الحبوب (شوكولاتة (Cap'n Crunchs Lucky Charms‏ لا مكنهما 
مجتمعين أن يكونا أكثر من <٤١‏ (بالرطل) من المزيج الإجمالي لتلبية متطلبات المزيج. 
حدد المستويات المثلى للمنتجات السبعة لوضع خطة تغذية أسبوعية خاصة بك بحيث a‏ التكلفة. 
لاحظ أن كل polio‏ المنتجات يجب ألا تحتوي على قيم كسرية (عدد الرطل أرقام صحيحة فقط). 
1- هذا التمرين مساهمة من د. Rick Wilson‏ من جامعة أوكلاهوما الحكومية لتوضيح قدرات 
النمذحة لبرنامج -Excel Solver‏ 
Col‏ تعمل مع مجموعة كبيرة من العمال المؤقتين (مجموعة من المتدربين وا متقاعدينء إلخ) 
لوضع مسودة خطة لفريق عمل مركز اتصال ليلي (للمستقبل القريب). لديك Lf‏ مجموعة 
صغيرة من العمال المتفرغين الذين هم ”ثوابتك“ - ولكنك وضعتهم بالفعل في الجدول» وقد أدى 
ذلك إلى متطلبات لتشغيل عمالة لديك. وأنت لا تهتم في النموذج بالعمال التفرغين. 
وتكون متطلبات تشغيل العمالة يومية وهي: ٠١‏ ليوم الاثنينء ٠١‏ ليوم الثلاثاء. VA‏ ليوم 
الأربعاء YY‏ ليوم الخميسء V‏ ليوم الجمعةء PY‏ ليوم السبت YOg‏ ليوم الأحد. 
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لديك من ۸ إلى ٠١‏ منهم لا يستطيعون العمل في عطلة نهاية الأسبوع (السبت أو الأحد). 
بالنسبة لهؤلاء الناس ”في يوم واحد فقط من أيام الأسبوع“» هناك ثلاث ورديات ممكنة: 
فسيعملون € أيام من إجمالي o‏ أيام عمل في gond‏ وتحصل إحدى الورديات على عطلة في 
يوم «NUI‏ ووردية أخرى في يوم الأربعاءء ووردية ثالثة في يوم الخميس. 
وعليك أن تخصص ثمانية أشخاص على الأقل لهذه الورديات ”في يوم واحد فقط من أيام الأسبوع“. 
وبالنسبة لجميع الورديات الأخرى Vs)‏ تتقيد بحجم العمالة المشغلة)» يعمل الشخص E‏ 
أيام من إجمالي ۷ أيام كل أسبوع. وسوف يعمل العمال Bab‏ أسبوعين ويومّي عطلة نهاية 
الأسبوع (وردية (CY / Y"‏ وتعتبر جميع التوليفات «ذات اليومين» اليومية الممكنة ورديات 
عمل مرتبطة ماعدا أي توليفات يحصل فيها العمال على عطلة ثلاثة أيام متتاليةء فتلك الأيام 
غير مسموح بها ولا يجب أن تكون في النموذج. 
نحن نعمل بنموذج بسيط جدًا - وبدون تكاليف؛ إذ يكون الهدف من نموذجنا هو إيجاد 
أقل عدد من العمال الذي يلبي الحد الأدنى اليومي المطلوب مركز الاتصال ولا يتم الاستعانة بأكثر 
من أربعة عمال إضافيين (فوق الحد الأدنى للمتطلبات) خلال أي يوم واحد. 
VIS‏ لا هكن لجميع الورديات (”يوم واحد فقط من أيام الأسبوع“ أو ورديات Y‏ / ( أن 
«يخصص» لها أكثر من ستة أشخاص. 
قم بإنشاء نموذج أساسي يقبل بهذه القيود ويعمل على تدنية العدد الإجمالي للأشخاص المطلوبين 
لتحقيق الحد الأدنى من المتطلبات. إذا كان هناك مشكلةء نعم» عدد الأشخاص عدد صحيح. 
-V‏ هذا التمرين أيضًا مساهمة من د. Rick Wilson‏ من جامعة أوكلاهوما الحكومية. يحاي السيناريو 
البسيط التالي "Black Book"‏ الموصوف في مقالة Business Week‏ عن إنتاج الكوكاكولا من عصير 
البرتقال. http://www.businessweek.com/articles/2013 -01- 31 coke-engineers-its-)‏ 
(orange-juice-with-an-algorithm, accessed February 2013‏ قم بإنشاء موذج برمجة 
خطية (LP)‏ مناسب لهذا السيناريو. 
بالنسبة للفترة الإنتاجية التاليةء يوجد خمس دفعات مختلفة من عصير البرتقال الخام يمكن 
خلطها gual ls‏ منتجات عصير -Orenthal James .GlowMorn SunnyQ «JU3;J!‏ 
في تكوين الخليط الأمثل من المنتجات الثلاثة من الدفعات الخمس المختلفةء يجب أن يهدف 
نموذج البرمجة الخطية إلى تعظيم صافي سعر البيع لكل جالون من امنتجات وتخفيض التكلفة 
المقدرة لكل جالون من العصير الخام. 
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ويتم هنا وصف خمس دفعات خام من عصير البرتقال من حيث درجة الحلاوة «Ils (Brix)‏ 
(Pulp)‏ والمخزون المتاح (جالون) والتكلفة (دولار / جالون)» وكلها ذاتية التفسير: 
- دفعة -١‏ أناناس برتقال Yo- pulp = VY brix = ١١ A‏ جالونء VY‏ دولار / جالون. 
- دفعة -Y‏ أناناس برتقال «pulp = ۰,۹ brix = ۱۷ B‏ ۲۰۰ جالونء YY,Y‏ دولار / جالون. 
- دفعة -Y‏ متوسط الحلاوة ۲۰ = VEY «agile ۱۷۵ pulp = ۰,۸ brix‏ دولار / جالون. 
- دفعة £- فالنسياء ۱۸ = pulp = ۲,۱ brix‏ ۳۰۰ جالونء EVY‏ دولار / جالون. 
- دفعة 0- برتقال 3 Y1o pulp = 1١,1 brix = Vé «Js‏ جالون» 06,Y‏ دولار / جالون. 
لاحظ أنه للتأكد من أن العصير الخام لا يصبح l> “G”‏ مرور الوقت» فإن أحد متطلبات 
الإنتاج هو أنه يتم بالضرورة استخدام “0٠‏ على الأقل من المخزون ال متاح من كل دفعة في hls‏ 
منتجات عصير البرتقال الثلاثة (وبالطبع لا يمكن استخدام أكثر من ال متاح). 
من منظرر المنتج» يجب أن يكون هناك ٠٠١‏ جالون على الأقل من خليط Wos SunnyQ‏ 
جالون على الأقل من كل من .OrenthalJamesg GlowMorn‏ وبالمثل؛ يشير الطلب المستقبلي 
المتوقع على المنتجات إلى أنه في هذه الفترة يلزم وجود إنتاج تام بمقدار ٠٠١‏ جالون على الأكثر من 
SunnyQ‏ وهل/ا؟ جالونًا على الأكثر من Y» + g GlowMorn‏ جالون على الأكثر من -OrenthalJames‏ 
لاحظ Lf‏ أنه عند خلط المنتجات من الدفعات الخمس» فإن الدفعة المنفردة لا يمكنها أن توفر 
أكثر من “6٠‏ من إجمالي كمية أي منتج تام» ويتم تطبيق ذلك على كل منتج على حدة. 
وتشمل سمات امنتجات الثلاثة ما يلي: 
- سعر البيع. 
- الحد الأقصى لمتوسط درجة حلاوة (brix)‏ المنتج المخلوط «Mel‏ 
- الحد الأدنى لمتوسط درجة حلاوة (brix)‏ المنتج المخلوط النهائي. 
- الحد الأقصى لمحتوى اللب. 
وتشير متطلبات ”اممتوسط“ الثلاثة إلى أن المتوسط. المرجح لكل العصير المخلوط ببعضه لذلك 
يجب أن يحقق انتج تلك المواصفات. 
:SunnyQ -‏ سعر البيع = AY‏ $ / جالون. Min Brix = 14,0 Max Brix = V‏ اراح -Max Pulp‏ 
:GlowMorn -‏ سعر البيع = -Max Pulp = VA Min Brix -Vi,Yo Max Brix = \ «jJl / $ V6‏ 
OrenthalJames -‏ سعر „Max Pulp = 1,1 Min Brix = 1,00 Max Brix = 1۷,۷0 s Jb / $ Wr = gi‏ 
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مفاهيم وأدوات البيانات الضخمة 


أهداف التعلم: 
pla -‏ ما هي البيانات الضخمة وكيف تجعل عام التحليلات يتغير. 
- فهم الحافز لتحليلات البيانات الضخمة وقائدي العمل لها. 
- الدراية التامة بنطاق عريض من تمكين التقنيات لتحليلات البيانات الضخمة. 
- تعلّم NoSQLs MapReduces Hadoop‏ من حيث ارتباطها بتحليلات البيانات الضخمة. 
- مقارنة وتناقض الاستخدامات المكملة لمستودعات البيانات وتقنيات البيانات الضخمة. 
- الدراية باختيار منصات وخدمات البيانات الضخمة. 
- فهم الحاجة إلى تحليلات التيار (تدفق البيانات) وتقدير إمكانياتها. 

- تعلّم تطبيقات تحليلات التيار (تدفق البيانات). 

لا تعتبر البيانات الضخمة - والتي تعني أشياء كثيرة لكثير من الناس - تقليعة تقنية جديدة. 
d E‏ من أولويات الأعمال التي من المحتمل أن تغير خريطة المنافسة بشكل عميق في 
الاقتصاد المتكامل على الصعيد العالمي في هذه eL‏ بالإضافة إلى توفير حلول ابتكارية لتحديات 
الأعمال الدائمة؛ إذ تسعى البيانات الضخمة والتخليلات لإيجاد طرق جديدة لتحويل عمليات 
ومنظمات وصناعات بأشرها وحتى المجتمع بالكامل. غير أن التغطية الإعلامية الشاملة تجعل 
من الصعب التمييز بين الدعاية والواقع. ويهدف هذا الفصل إلى توفير تغطية شاملة للبيانات 
الضخمة وتقنياتها التمكينية ومفاهيم التحليلات المرتبطة بها؛ وذلك للمساعدة في فهم قدرات 
وقيود هذه التقنية حديثة الظهور. فيبدأ الفصل بتعريف البيانات الضخمة ومفاهيمها المرتبطة, 
يلي ذلك التفاصيل الفنية للتقنيات التمكينية» والتي منها -NoSQLs MapReduces Hadoop‏ 
ونقدم Ño LÀ]‏ مقارنًا بين مستودعات البيانات وتحليلات البيانات الضخمة. في حين يتم 
تخصيص الجزء الأخير من الفصل لتحليلات LII‏ والتي تعتبر إحدى أقيم المقترحات الواعدة 
لتحليلات البيانات الضخمة. 
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V-V‏ مقال افتتاحي: تحليل حركة العملاء في شركة اتصالات باستخدام طرق 
البيانات الضخمة: 


خلفة: 


أرادت شركة اتصالات (تسمى (AT) Access Telecom‏ لأسباب تتعلق بالخصوصية) الحد من تحول 
العملاء عن خدمات الاتصالات الخاصة بها. وبالرغم من أن انتقال العملاء بين الشركات في صناعة 
الاتصالات يعد Bal‏ شائعًاء إلا أن شركة AT‏ كانت تفقد عملاءها معدل مقلق. وهذه ظاهرةٌ لها عدة 
أسباب وأيضًا لها dolo‏ ممكنة. فقد علمت إدارة الشركة أن العديد من الإلغاءات كانت بسبب مكالمات 
بين العملاء وقسم خدمة العملاء. ولدراسة المشكلة بصورة أعمق» تم تشكيل لجنة تضم أعضاء من 
مكتب علاقات العملاء وقسم تقنية المعلومات» وكانت مهمتهم هي النظر في كيفية تقليص مشكلة تحول 
العملاء £u‏ على تحليل JoLel‏ اتصال العملاء .Kalgotras Zadeh Shardas Asamoah)‏ 2016(- 


عقبات البيانات الضخمة: 
عندما يواجه العملاء مشكلة في مسائل معينة مثل الفواتير الخاصة بهم والخطة وجودة 
à LLLI‏ فإنهم يتواصلون مع الشركة بطرق متعددة, منها: مركز الاتصال (call center)‏ وموقع 
الويب الخاص بالشركة (من خلال روابط اتصل بنا ("contact us"‏ ومركز خدمة الحضور الشخصىي 
(walk-ins)‏ ومكن للعملاء إلغاء أي حساب من خلال إحدى التفاعلات المذكورة. أرادت الشركة 
النظر فيما إذا كان تحليل تفاعلات العملاء هذه يمكن أن يُنتج أي أفكار حول أسئلة العملاء أو قناة 
(قنوات) الاتصال التي استخدموها قبل إلغاء حسابهم. وظهرت البيانات التي تم إنشاؤها بسبب 
هذه التفاعلات إما في صورة نصية أو صوتية. ولذا؛ سينبغي على شركة AT‏ أن تقوم بتجميع 
كل البيانات في موقع واحد. فقامت الشركة yari‏ استخدام المنصات التقليدية لإدارة البيانات» 
ولكنها اكتشفت سريعًا أنها غير كافية ملعالجة تحليل البيانات المتقدم في السيناريو الذي يحتوي 
على تنسيقات متعددة للبيانات من مصادر متعددة Thusoo)‏ و5880 .Anthonys‏ 2010). 
كان هناك تحديان رئيسان في تحليل هذه البيانات وهما: المصادر المتعددة للبيانات والتي 
تؤدي إلى مجموعة متنوعة من البيانات وكذلك الحجم الكبير للبيانات. ١‏ 
-١‏ البيانات من مصادر متعددة: يستطيع العملاء التواصل مع الشركة عن طريق الوصول إلى 
حساباتهم على موقع الويب الخاص بالشركة» مما يسمح لشركة AT‏ بإنشاء سجل معلومات 
على الويب حول blis‏ العميل. وقد تمكنت الشركة باستخدام مسار هذا السجل من تحديد 
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ما إذا كان العميل قد قام عبر الإنترنت بمراجعة خطته الحالية أو استلامها أو تقديم شكوى 
بشأنها أو التحقق من الفاتورة وكذلك تحديد متى قام بذلك. وفي مركز خدمة العملاء OS‏ 
للعملاء LÉ‏ تسجيل شكوى بشأن الخدمة أو تقديم طلب بتغيير الباقة أو إلغاء الخدمة. 
Clas‏ هذه الأنشطة في نظام معاملات الشركة وبعد ذلك في مستودع بيانات المنشأة. Tasio‏ 
يمكن للعميل الاتصال بمركز خدمة العملاء Gala‏ وإجراء معاملاته التجارية وكأنه موجود 
شخصيًا في مركز خدمة العملاء. وكانت سجلات المكالمات متاحة في نظام واحد مع سجل 
بالأسباب التي يتصل العميل من أجلها. ومن أجل إجراء تحليل له معنىء كان لا بد من 
تحويل مجموعات البيانات الفردية إلى تنسيقات مهيكلة متشابهة. 

-Y‏ حجم البيانات: كان التحدي الثاني هو الكمية الهائلة من البيانات من المصادر الثلاثة التي 
استلزم الأمر استخراجها وتنظيفها وإعادة هيكلتها وتحليلها. وبالرغم من أن غالبية مشروعات 
تحليلات البيانات السابقة اعتمدت على مجموعة عينات صغيرة من البيانات» إلا أن شركة 
AT‏ قررت الاستفادة من التنوع المتعدد ومصادر البيانات جنبًا إلى جنب مع الحجم الكبير 
للبيانات المسجلة لتوليد العديد من الأفكار كلما أمكن. 
إن النهج التحلياي الذي يمكنه استخدام جميع قنوات ومصادر البيانات» رغم ضخامتهاء سيكون 

قادرًا على توليد أفكار غنية وعميقة من البيانات للمساعدة في تقليل الإلغاءات. 


الحل: 

تم الاعتماد على بنية موحدة للبيانات الضخمة من شركة تيراداتا أستر (Teradata Aster)‏ 
لإدارة وتحليل البيانات الضخمة ذات الهيكلة ا متعددة. وسنعرض في القسم (I-V)‏ بشيء من 
التفصيل لشركة Teradata Aster‏ كما يعرض الشكل Guy (V-V)‏ تخطيطيًا للبيانات التي تم 
تركيبها. وقد تم إنشاء ثلاثة جداول élo‏ على كل مصدر OLL‏ حيث يحتوي كل جدول على 
المتغيرات التالية: رقم العميلء وقناة الاتصالء وختم التاريخ / الوقت. والإجراء ASE‏ وقبل 
الإلغاء النهائي للخدمةء يمكن لمتغير الإجراء المتخذ أن يكون واحدًا أو ASÍ‏ من هذه الخيارات 
الإحدى عشرة (التي تم تبسيطها لهذه الحالة): تقديم الاعتراض على الفاتورة أو طلب تحديث 
الباقةء أو طلب تخفيض الباقةء أو القيام بتحديث الملف الشخصيء أو عرض ملخص الحساب» 
أو الوصول إلى دعم العملاءء أو عرض الفاتورة أو مراجعة العقد. أو الوصول إلى وظيفة تحديد 
موقع المتجر على الويب» أو الوصول إلى قسم الأسئلة اللتكررة على الويب» أو استعراض الأجهزة. 
وقد ركز هدف التحليل على إيجاد ا مسار الأكثر شيوعًا المؤدي إلى إلغاء الخدمة نهائيًا. وقد تم 
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تقسيم البيانات إلى مجموعة سلسلة من الأحداث تشتمل على عميل معين في فترة زمنية محددة 
)0 أيام على جميع قنوات الاتصال) كجلسة واحدة. sels‏ تم استخدام وظيفة nPath‏ لتسلسل 
الوقت الخاصة بشركة Aster‏ (والتي تم تفعيلها في إطار (SQL-MapReduce‏ لتحليل الاتجاهات 
الشائعة التي أدت إلى إلغاء الخدمة. 





























Sources: Teradata Corp. 
Teradata Aster بيانات متعددة مدمجة في‎ jalas :Y-V JS s 


النتائج: 

أشارت النتائج الأولية إلى العديد من المسارات التي قد تؤدي إلى طلب إلغاء الخدمةء مما 
من الشركة من تحديد آلاف الطرق التي قد يلجأ إليها العميل لإلغاء الخدمة. وتم إجراء تحليل 
متابعة لتحديد أكثر الطرق تكرارًا لطلبات الإلغاء. وتم الاصطلاح على هذا الإجراء باسم المسار 
الذهبي “Golden Path"‏ وتم تحديد ۲۰ مسارًا كانوا هم الأكثر تسببًا في الإلغاء في الأجل القصير 
أو الطويل. ويعرض الشكل (Y-V)‏ عينة لذلك. 

وقد ساعد هذا التحليل الشركة على تحديد العميل قبل إلغاء الخدمة وتقديم حوافز له أو على 
الأقل تصعيد قرار المشكلة إلى مستوى لا يرتقي إلى إلغاء الخدمة من جانب العميل. 
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مركز الإتصال:إلعاء الخدمة :مركز A‏ 


Sas‏ القراتير 
متجر anal‏ 


:مركز Je‏ 
اشكاوى الخدمة 


JE pie 
الفواتير‎ 


متجر:الحسايات الجديدةا 











متجر:شکاری 





Sources: Teradata Corp. 


شكل V-V‏ التصوير البياني لأعلى عشرين مسارًا للتصوير 

ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 

لا تتطلب كل مشاكل الأعمال استخدام منصة تحليلات البيانات الضخمة: بالرغم من أنه 
يُفضل استخدامها في هذا الموقف. وكان التحدي الرئيسي يدور حول خصائص البيانات محل 
البحث. وقد مثلت الأنواع الثلاثة ا مختلفة من مجموعات بيانات تفاعل العميل تحديًا في 
التحليل. كانت تنسيقات وحقول البيانات المتولدة في كل من هذه الأنظمة ضخمة:ء وكذلك كان 
حجم تلك البيانات كبيراء مما أدى إلى ضرورة استخدام منصة تستخدم تقنيات تسمح بتحليل 
حجم هائل من البيانات التي db‏ في تنسيقات متنوعة. 

وما يسترعي الانتباه Lad‏ هو قيام شركة AT‏ بتوفيق أسئلة البيانات المطروحة على إستراتيجية 
أعمال المنظمة. وقد أخبرت الأسئلة Ul‏ عن نوع التحليل الذي تم إجراؤه. ومن المهم تَمَهُم 
أنه بالنسبة لأي تطبيق لبنية البيانات الضخمة: فإن إستراتيجية أعمال المنظمة وتوليد الأسئلة 
المرتبطة هما مفاتيح تحديد نوع التحليل المراد إجراؤه. 
أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ ما هي المشكلة التي أحدثها إلغاء خدمة العملاء لاستمرار أعمال شركة SAT‏ 
-Y‏ اذكر مع الشرح العقبات الفنية التي تحدثها طبيعة وخصائص بيانات شركة AT‏ 
-Y‏ ما هو تقسيم البيانات؟ وماذا تحتم على AT‏ القيام بتقسيم بياناتها؟ 
ع- قم بإعداد دراسات أخرى تم فيها استخدام نماذج تحول العميل. ما هي أنواع المتغيرات التي 

تم استخدامها في تلك الدراسات؟ كيف تختلف هذه JAL‏ الافتتاحية؟ 
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0- اذكر منصات أخرى شائعة غير Teradata Aster‏ لتحليلات البيانات الضخمة التى بمكنها 
التعامل مع التحليل الموضح في الحالة السابقة. 


Y-V‏ تعريف البيانات الضخمة: 

بسكل استخدام البيانات لفهم الزبائن / العملاء وعمليات الأعمال بهدف الحفاظ على 
(وتعزيز) التمو والربحية تحديًا Des‏ ويتزايد هذا التحدي بالنسبة لمؤسسات اليوم. وقد 
أصبحت معالجة البيانات بالوسائل التقليدية في حينها غير عمليةء وذلك بسبب توافر المزيد 
والمزيد من البيانات في مختلف الأشكال والأنمماطء وتسمى هذه الظاهرة في وقتنا الراهن ب 
”البيانات الضخمة“. حيث تحظى بتغطية إعلامية كبيرة بالإضافة إلى استحواذها على اهتمام 
مستخدمي الأعمال ومتخصصي تقنية المعلومات بشكل متزايد. ونتيجة لذلك؛ فقد أصبح هناك 
مبالغة وإفراط في استخدام عبارة البيانات الضخمة مما جعلها عبارة طنانة في التسويق. 

وبالنسبة لذوي الاهتمامات والخلفيات المختلفة فإن البيانات الضخمة تعني لهم أشياء مختلفة. 
وقد تم استخدام مصطلح البيانات الضخمة بشكل تقليدي لوصف الكميات الهائلة من البيانات 
التي تم تحليلها عن طريق منظمات ضخمة مثل جوجل أو مشاريع العلوم البحثية في ناسا. غير 
أن هذا المصطلح يُعد مصطلكًا نسبيًا لمعظم الأعمال؛ فكلمة ”ضخمة“ تعتمد على حجم المنظمة. 
حيث تدور النقطة الأساسية حول إيجاد قيمة جديدة داخل وخارج مصادر البيانات التقليدية. 
وتكشف إزاحة حدود تحليلات البيانات عن إحصاءات وفرص Jod‏ وتعتمد كلمة «ضخمة» 
على المكان الذي بدأت منه وكيف يسير تقدمك. وينبغي أن تضع في اعتبارك الوصف العام 
للبيانات الضخمة. فالبيانات الضخمة هي التي تتجاوز نطاق بيئات الأجهزة شائعة الاستخدام 
أو قدرات أدوات البرامج المستخدمة لجمعها وإدارتها ومعالجتها في خلال فترة زمنية مقبولة من 
Jb‏ ا مستخدمين. وقد أصبح مصطلح البيانات الضخمة مصطلكًا شائعًا لوصف النمو المتسارع 
ومدى توفرء واستخدام ا معلومات» سواء كان مهيكلًا أم -Y‏ وقد كتب الكثيرون عن اتجاه البيانات 
الضخمة وكيف هكن أن يكون بمثابة أساس للابتكار, وا مفاضلة. والنمو. وبسبب التحديات 
التقنية في إدارة الحجم الكبير للبيانات الواردة من مصادر متعددة: وأحيانًا بسرعة كبيرة فقد تم 
Sources: Asamoah, D., Sharda, R., Zadeh, A., & Kalgotra, P. (2016). Preparing a big Data analytics professional:‏ 
A pedagogic experience. In DSI 2016 Conference, Austin, TX. Thusoo, A., Shao, Z., & Anthony, S. (2010).‏ 


Data warehousing and analytics infrastructure at Facebook. In Proceedings of the 2010 ACM SIGMOD 
International Conference on Management of Data (p. 1013). doi: 10.1145/1807167. 1807278. 
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تطوير تقنيات جديدة إضافية للتغلب على التحديات التقنية. Bale‏ ما ترتبط عبارة البيانات 
الضخمة بهذه التقنيات. وفي بعض الأحيان يتم توسيع مصطلح «البيانات الضخمة» على أنه 
تحليلات البيانات الضخمةء وذلك بسبب أن الاستخدام الأساسي لتخزين مثل هذه البيانات يؤدي 
للحصول على إحصاءات من خلال التحليلات. غير أن هذا المصطلح يصبح ذا محتوى مرن؛ إذ قد 
يعني أشياء مختلفة لأشخاص مختلفين. وفي هذا الفصل سوف نقوم باستخدام المصطلح الأصلي» 
لأن هدفنا هو تعريفك بمجموعات البيانات الضخمة وقدراتها في توليد الأفكار. 

من أين gb‏ البيانات الضخمة؟ أبس ط إجابة عن هذا السؤال هي أن البيانات الضخمة «في 
كل مكان». حيث يتم التعامل الآن مع المصادر التي تم تجاهلها بسبب القيود الفنية على أنها 
مناجم ذهب. وقد تأت البيانات الضخمة من سجلات الويب» وتحديد الهوية للموجات ASLI‏ 
(RFID)‏ والأنظمة LLLI‏ لتحديد المواقع (GPS)‏ وشبكات الاستشعارء والشبكات الاجتماعية 
والوثائق النصية المعتمدة على الإنترنت» وفهارس البحث على الإنترنت» والسجلات التفصيلية 
للمكاطمات» وعلم الفلك» وعلوم الغلاف الجويء oleg‏ الأحياء» ees‏ الجينات» والفيزياء النووية, 
والتجارب البيوكيميائيةء والسجلات الطبيةء والبحوث العلميةء وا مراقبة العسكرية» وأرشيف 
الصور الفوتوغرافية» وأرشيف الفيديوء بالإضافة إلى ممارسات التجارة الإلكترونية على نطاق 
واسع. وليست البيانات الضخمة بالشيء الجديدء لكن الجديد هو التغير ا مستمر في تعريف 
وهيكل البيانات الضخمة. ومنذ ظهور مستودعات البيانات في أوائل التسعينيات فإن الشركات 
تقوم بتخزين وتحليل كميات ضخمة من البيانات. وعلى الرغم من أن تيرابايتس “terabytes”‏ 
كان يُستخدم كمرادف لمستودعات البيانات الضخمة: إلا أن هذا المصطلح تم استبداله الآن 
مصطلح إكسابايتس “exabytes”‏ ومازال معدل النمو في حجم البيانات مستمرًا في التصاعد 
مع سعي ال منظمات إلى تخزين وتحليل مستويات أعلى من تفاصيل المعاملات» Ía‏ عن بيانات 
الويب والميكنةء لاكتساب فهم أفضل لسلوك العملاء وسير الأعمال. 

ويعتقد الكثير من (الأكادهيين ومحللي / قادة الصناعة على حد سواء) أن إطلاق عبارة 
«البيانات الضخمة» على البيانات ذات الحجم الهائل هي تسمية خاطئة. فما تقوله وما تعنيه 
ليس بالضبط نفس الشيء. بمعنى أن البيانات الضخمة ليست فقط «ضخمة». فحجم البيانات 
الهائل هو خاصية واحدة فقط من ضمن عدة خصائص والتي ترتبط في الغالب بالبيانات الضخمة 
وتتضمن هذه الخصائص MS‏ من التنوع والسرعة. والصدقء والتقلب» واقتراح القيمةء وغيرها. 
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تعريف البيانات الضخمة من خلال مصطلحات ”۷“: 

تُعرّف البيانات الضخمة من خلال المصطلحات الثلاثة للاختصار ”۷“ وهي: الحجم «volume‏ 
والتنوع variety‏ والسرعة .velocity‏ وبالإضافة إلى هذه الاختصارات الثلاثة ”۷“ فإننا نرى 
بعض المقدمين slo JI‏ لحلول البيانات الضخمة يضيفون عددًا من ”۷“ الأخرى» مثل الصدق 
(IBM) veracity‏ والتباين (SAS) variability‏ بالإضافة إلى اقتراح القيمة -value proposition‏ 

الحجم: من الواضح أن السمة الأكثر شيوعًا للبيانات الضخمة هي الحجم. وقد ساهمت عدة 
عوامل في الزيادة الهائلة في حجم البيانات. مثل البيانات القائمة على المعاملات والتي تم تخزينها على 
مر السنين» والبيانات النصية المتدفقة باستمرار من وسائل التواصل الاجتماعي» والكميات المتزايدة من 
بيانات الاستشعار التي يتم جمعهاء بالإضافة إلى بيانات GPSs RFID‏ التي يتم إنشاؤها تلقائيّه وغيرها. 
وقد أدى حجم البيانات المفرط في الماضي إلى ظهور مشاكل في التخزين» سواء كانت هذه المشاكل فنية 
أو مالية. غير أنه حاليًا ومع استخدام التقنيات المتطورة والمقترنة بتناقص تكاليف التخزينء فإن هذه 
المشكلات b‏ تعد مهمة؛ وبدلًا من US‏ فقد ظهرت مشكلات أخرىء latas‏ كيفية تحديد الملاءمة فيما 
بين كميات كبيرة من البيانات وكيفية إنشاء قيمة من البيانات التي تعتبر ذات صلة. 

وكما ذكر من قبل, فإن مصطلح ضخمة هو مصطلح نسبي. فهو يتغير بمرور الوقت كما تختلف 
النظرة إليه باختلاف المنظمات. ومع الزيادة المذهلة في حجم البيانات» فإن تسمية المستوى التالي 
من البيانات الضخمة أيضًا كانت تمثل تحديًا Hus‏ وقد استبدلت أعلى مجموعة من البيانات 
والتي كانت تسمى بيتابايتس (PB) petabytes‏ ليحل محلها زيتابايتس (ZB)‏ والتي هي عبارة 
عن تريليون جيجابيت (GB)‏ أو مليار تيرابايت (TB)‏ وتقدم رؤية فنية ale dod, (V-V)‏ عن 
حجم وتسمية وحدات مستودعات البيانات الضخمة. 

ومن منظور تاريخي قريب فإن العام كان elle‏ حوالي ZB «A‏ من البيانات في عام WS‏ 
وبحلول عام «Ve‏ تخطت هذه المجموعة حاجز ال ZB ١‏ وفي نهاية عام 2701١‏ كان العدد قد 
وصل إلى -ZB VA‏ ومن المتوقع أن يصل العدد إلى ££ ZB‏ بحلول عام ۲۰۲۰ )2014 -(Adshead,‏ 
ومع نمو أجهزة الاستشعار وشبكة الإنترنت للأشياء IOT)‏ - والتي سنقدمها في الفصل التالي)» OB‏ 
هذه التوقعات قد تكون خاطئة. وعلى الرغم من أن هذه الأرقام مذهلة من حيث الحجم» فإن 
التحديات والفرص التي db‏ معها هي Val‏ كذلك. 

رؤية فنية /ا-1: حجم البيانات يتضخم بشكل أكبر وأكبر 

إن قياس حجم البيانات يواجه صعوبة في مواكبة الأسماء الجديدة. فنحن جميعًا نعرف الكيلوبايت 

KB)‏ وهو ۱,۰۰۰ (cob‏ والميجابايت MB)‏ وهي مليون (Cul‏ والجيجابايت GB)‏ وهي مليار 
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(cob‏ والتيرابايت TB)‏ وهي تريليون بايت). وخلاف ذلكء فإن الأسماء المعطاة لأحجام البيانات 
جديدة نسبيًا بالنسبة لمعظمنا. ويوضح الجدول التالي ما b‏ بعد التيرابايت وما بعده. 














الاسم الرمز القيمة 
كيلوبايت et KB‏ 
ميجابايت v MB‏ 
جيجابايت GB‏ ف 
تيرابايت mu TB‏ 
بيتابايت v PB‏ 
إكسابايت y^ EB‏ 
زيتابايت v ZB‏ 
يوتابايت yt YB‏ 
برونتوبايت* BB‏ ل 
جيجوبايت* ve GeB‏ 





* اسم / رمز لم يعتمد رسميًا حتى الآن من قبل SI‏ (النظام الدولي للوحدات). 


ضع في اعتبارك أنه يتم إنشاء إكسابايت من البيانات على الإنترنت كل يوم والتي تعادل 
٠‏ مليون قرص فيديو رقمي DVDs‏ من المعلومات ذات القيمة. وعندما يتعلق الأمر بكمية 
المعلومات التي تمتد عبر الويب OL «ele JS‏ فكرة وجود كميات أكبر من البيانات - وهي 
زيتابايت - ليست بعيدة جدًا. وفي الحقيقة. فإن خبراء الصناعة يقدرون بالفعل أننا سنشاهد 
سنويًا عبر الإنترنت VY‏ زيتابايت من حركة مرور البيانات بحلول عام Y VV‏ - ومن الممكن أن 
تقفز لتصل إلى ۲۳ زيتابايت بحلول عام Y-Y‏ ومن المتوقع أن تصل زيارات الإنترنت إلى ٠٠١‏ 
جيجابايت لكل فرد sz a‏ بحلول عام aues YY‏ الإشارة إلى يوتابايت» فإنه غالبًا ما يتساءل 
بعض علماء البيانات الضخمة عن مقدار البيانات التي لدی NSA‏ أو FBI‏ عن الناس إجمالا. كما 
أن وضع الشروط الخاصة بأقراص الفيديو الرقمية DVDs‏ يوتابايت سوف يتطلب YO*‏ تريليون 
منهم. أما يوتابايت» والتي هي عبارة عن Y‏ متبوعًا ب Gio YV‏ فإنها إلى الآن لم يتم اعتمادها 
من SI‏ الرسمية غير أنه من الواضح أنها معترف بها من قبل بعض الناس في مجتمع القياس» حيث 
يمكن استخدام هذا الحجم من الضخامة لوصف مقدار بيانات الاستشعار التي سوف نحصل 
عليها من الإنترنت في العقد القادم» إن لم يكن قبل ذلك. 
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أما بالنسبة ل جيجوبايت فهي تمثل ٠١‏ مرفوعة إلى الأس Ye‏ وفيما يتعلق بالمصدر الذي gb‏ 
منه البيانات الضخمة, فإنه يجب أخذ ما يلي في الاعتبار: 
- يقوم مصادم الهدرونات الكبير CERN‏ بتوليد Y‏ بيتابايت في الثانية الواحدة. 
- تنتج أجهزة الاستشعار من محرك طائرة بوينغ "١‏ تيرابايت من البيانات كل ساعة. 
- يتم استيعاب ٠٠١‏ تيرابايت من البيانات الجديدة كل يوم في قواعد بيانات „Facebook‏ 
- يتم تنزيل ٠٠١‏ تسجيل من تسجيلات الفيديو في ARSI‏ مع ترجمة Y‏ تيرابايت كل دقيقة على اليوتيوب. 
- سوف يقوم التلسكوب المقترح لمقياس الكيلومتر المربع (وهو أكبر تلسكوب في العام) بتوليد 

إكسابايت من البيانات يوميًا. 

التنوع: تتش كل البيانات في الوقت الحاضر بجميع أنواع التنسيقات - بدءًا من قواعد البيانات 
التقليدية إلى مخازن البيانات الهرمية والتي cd tod‏ من قبل المستخدمين النهائيين بالإضافة إلى أنظمة 
المعالجة التحليلية الفورية» والوثائق النصية, والبريد الإلكترونيء XML‏ والبيانات التي kde‏ بواسطة 
جهاز استشعارء وبيانات الاستشعارء فضلًا عن بيانات الفيديو. «2s alls‏ وبيانات شريط مؤشرات 
الأمهم. وتشير بعض التقديرات إلى أن ۸٠‏ إلى XAO‏ من بيانات جميع المنظمات تأخذ أحد الأشكال 
التنظيمية المهيكلة أو شبه المهيكلة (وهو تنسيق غير مناسب ممخططات قواعد البيانات التقليدية)» غير 
أنه لا هكن إنكار قيمتهء وبالتالي» فإنه ينبغي تضمينه في التحليلات من أجل دعم القرار. 

السرعة: وفقًا لما ذكره «Gartner‏ فإن السرعة يُقصد بها US‏ من السرعة في إنتاج البيانات ومدى 
سرعة معالجة البيانات (بمعنى أن يتم التقاطها وتخزينها وتحليلها) من أجل تلبية الحاجة أو الطلب. 
وتقوم بطاقات التعريف اللاسلكية RFID‏ وأجهزة الاستشعار الآلية بالإضافة إلى أجهزة GPS‏ 
والعدادات الذكية بالعمل على التوجه بالاحتياج المتزايد للتعامل مع سيول البيانات في الوقت ال مناسب 
تقريبًا. ورا تكون السرعة هي الخاصية الأكثر إغفالًا من خواص البيانات الضخمة؛ حيث إن إعطاء 
رد الفعل بسرعة كافية للتعامل مع السرعة هشل to‏ لمعظم المنظمات. وبالنسبة للبيئات ذات 
الحساسية تجاه الوقت» فإن ساعة التكلفة البديلة للبيانات تبدأ بتحديد اللحظة التي يتم فيها إنشاء 
البيانات. ومع مرور الوقت, تتراجع القيمة المقترحة للبيانات إلى أن تصبح في نهاية !مطاف عدهة 
القيمة. ويؤدي الوصول إلى البيانات والاستجابة للظروف بشكل أسرع Gho‏ إلى esta‏ أكثر فائدة 
سواء أكان الموضوع يتعلق بصحة المريضء أو سلامة نظام ا مرورء أو صحة السندات الاستثمارية. 

وفي عاصفة البيانات الضخمة التي نش هدها Glo‏ فإن جميع الأشخاص تقريبًا يركزون على 
تحليلات حالة الراحة at-rest analytics‏ وذلك باستخدام أنظمة برامج وأجهزة مُحَسَّنة لتجميع 
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كميات yS‏ من مصادر البيانات المختلفة. des‏ الرغم من أن هذا الأمر مهم للغاية فضلًا عن 
قيمته العاليةء إلا أن هناك فئة أخرى من التحليلات» مدفوعة بسرعة البيانات الضخمة, وتسمى 
«تحليلات تدفق البيانات» أو «التحليلات في حالة الحركة»» والتي تتطور بسرعة. فإذا تم القيام 
بتحليلات تدفق البيانات بشكل صحيح ففي هذه الحالة يمكنها أن تكون ذات قيمة كبيرةء بل إنها 
قد تكون أكثر قيمة في بعض بيئات العمل من تحليلات حالة الراحة .at-rest analytics‏ وسوف 
نتناول هذا الموضوع بشيء من التفصيل o‏ في هذا الفصل. 

الصدق: الصدق هو مصطلح تم صياغته بواسطة IBM‏ والذي يُستخدم على أنه ال ”۷“ الرابعة 
لوصف البيانات الضخمة. ويشير هذا المصطلح إلى التطابق مع الحقائق: الدقةء أو الجودة, أو 
الصدقء أو الثقة في البيانات. وغالبًا ما يتم استخدام الأدوات والأساليب من أجل التعامل مع 
صحة البيانات الضخمة وذلك عن طريق تحويل إلى بيانات ذات جودة عالية وجديرة بالثقة. 

القابلية للتغيير: فضلا عن تزايد السرعات والتنوع في البيانات» يمكن أن تكون تدفقات البيانات 
غير متسقة بدرجة كبيرة مع القمم الدورية. هل هناك شيء كبير يتجه نحو وسائل التواصل 
الاجتماعي؟ رها يكون هناك IPO‏ (طرح عام (dass‏ رفيع المستوى يلوح في الأفق. وربما تصبح 
السباحة مع الخنازير في جزر البهاما فجأة نشاطًا واجب الأداء أثناء العطلة. كما يمكن أن تكون 
الأحمال القصوى للبيانات اليومية وا موسمية والناجمة عن الحدث متغيرة إلى حد كبير مما JS‏ 
تحديًا للإدارة - خاصة مع وسائل التواصل الاجتماعي المعنية. 

عرض القيمة: تتمثل الإثارة حول البيانات الضخمة في عروض القيمة الخاصة بها. أما الفكرة 
المسبقة حول البيانات «الضخمة» فتتمثل في كونها تحتوي (أو لديها قدرة أكبر على احتواء) ا مزيد 
من الأنماط والأشكال المثيرة للاهتمام أكثر من البيانات «الصغيرة». وبالتاليء فإن المنظمات يمكنها 
أن تكتسب قيمة تجارية أكبر من خلال تحليل البيانات الضخمة والغنية بالميزات» والتي قد لا 
يمكنها أن تكتسبها بطريقة أخرى. وعلى الرغم من أن المستخدمين يمكنهم اكتشاف الأماط à‏ 
مجموعات البيانات الصغيرة من خلال استخدام أساليب إحصائية بسيطة وطرق تعلّم الآلة أو 
أدوات طلب البحث وإعداد التقارير المخصصة: إلا أن البيانات الضخمة تعني تحليلات «ضخمة». 
وتعني التحليلات الضخمة رؤية أكبر وأشياء وقرارات أفضلء والتي تحتاج إليها كل منظمة. 

ومن المرجح أن تتم إضافة المزيد من الخصائص Le)‏ تكون المزيد من (V‏ إلى تلك القائمة, 
وذلك نظرًا لكون التعريف الدقيق للبيانات الضخمة (أو بنودها اللاحقة) لازال مطروحًا للمناقشة 
المستمرة في الدوائر الأكاديمية والصناعية. وبغض النظر عما يحدثء OB‏ أهمية وعرض قيمة البيانات 
الضخمة oes‏ لتبقى. ويعرض الشكل (P-V)‏ بنية مفاهيمية حيث يتم تحويل البيانات الضخمة 
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(الموجودة في الجانب الأيسر من الشكل) إلى رؤية عملية من خلال استخدام مزيج من التحليلات 
المتقدمة وتقدهها de sax‏ متنوعة من المستخدمين / الأدوار المختلفة لاتخاذ قرارات أسرع / أفضل. 





























SOURCE: ASTERDATA-A TERADATA COMPANY. 
المستوى لحلول البيانات الضخمة‎ Jle بنية مفاهيمية‎ :Y-V شكل‎ 
وهناك مصطلح آخر تتم إضافته إلى الكلمات الطنانة للبيانات الضخمة وهو مصطلح البيانات‎ 
أمثلة لأنواع متعددة من البيانات في‎ (V-V) وتعرض الحالة العملية‎ „alternative data البديلة‎ 
عدد من السيناريوهات المختلفة.‎ 


حالة عملية 1-۷ 
بيانات بديلة لتحليلات أو توقعات السوق 

يُعد الحصول على توقعات جيدة وفهم الوضع بشكل جيد al‏ ضروريًا لأي سيناريو. 

إلا أنه مهم بشكل خاص iad‏ صناعة الاستثمار. كما أن إمكانية حصول المستثمر على 

مؤشر مبكر لكيفية عمل مبيعات معينة لمتاجر التجزئة من ال ممكن أن تمنحه Ad‏ حول 

شراء أو بيع أسهم هذا البائع حتى قبل أن تصدر تقارير الأرباح. وتّعد مشكلة التنبؤ 
Sources: Higginbotham, S. )2012(. As data gets bigger, what comes after a yottabyte? gigaom.‏ 
com/2012/10/30/as-data-gets-bigger- what-comes-after-a-yottabyte (accessed August 2016). Cisco.‏ 


(2016). The zettabyte era: Trends and analysis. cisco.com/c/en/us/solutions/collateral/service-provider/ 
visualnetworking- index-vni/vni-hyperconnectivity-wp.pdf (accessed August 2016). 
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بالنشاط الاقتصادي أو ELLI‏ ا محلي الذي يعتمد على مجموعة متنوعة من البيانات بخلاف 
بيانات التجزئة المعتادة هي ظاهرة حديثة جدًا كما أنها أدت إلى ظهور عبارة أخرى Lb‏ 
وهي «البيانات البديلة». ويُّعد المزيج الرئيس في هذه الفئة من البيانات البديلة هو صور 
الأقمار الصناعية» غير أنه يتضمن Uo]‏ بيانات أخرى مثل وسائل التواصل الاجتماعي» أو 
الإيداعات الحكومية» أو إعلانات الوظائف. أو أنماط حركة المرورء أو التغييرات في مواقف 
السيارات أو المساحات المفتوحة التي اكتُشقّت من خلال صور الأقمار الصناعيةء بالإضافة 
إلى أماط استخدام الهاتف المحمول في أي موقع محدد خلال أي وقت محدد. وأنماط 
البحث على محركات البحثء وغير ذلك. وقد قامت شركة فيسبوك وغيرها من الشركات 
بالاستثمار في الأقمار الصناعية محاولةٌ تصوير العام كله بشكل يومي بحيث تتمكن من 
تعقب التغييرات اليومية في أي مكان ومن ثم استخدام المعلومات من أجل التنبؤ. وقد 
ورد العديد من الأمثلة المثيرة للاهتمام لتنبؤات متقدمة وموثوقة بدرجة عالية. وفي 
الواقع» فإن هذا النشاط تقوده شركات ناشئة. وفيما يلي بعض الأمثلة: 

- استخدام Facebook‏ محرك التعرف على الصور من أجل Jules‏ أكثر من ٠٤,١‏ مليار 
صورة بغرض تحليل كل ركن من أركان العام لتحديد المناطق ذات الاتصال المنخفض. 

- راقبت شركة RS Metrics‏ مواقف السيارات عبر الولايات المتحدة من خلال 
صناديق الاستثمار المختلفة.ء حيث توقعت شركة RS Metrics‏ تحقيق أرباح قوية في 
الربع الثاني من عام ۲١٠١‏ لصالح JC Penney‏ وقد اعتمدت الشركة في توقعاتها على 
تحليل مواقف السيارات. وقد استفاد عملاؤها (في الغالب عملاء صناديق الاستثمار) من 
هذه الرؤية المتقدمة. وقد وردت قصة أخرى مشابهة ل Wal-Mart‏ والتي استخدمت 
أعداد السيارات الموجودة في مواقف السيارات الخاصة بها من أجل توقع المبيعات. 

- قيام شركة Orbital Insights‏ بتوفير مؤشرات الاقتصاد AI‏ لقطاعات الصناعة 
المختلفة من خلال استخدام بيانات صور الأقمار الصناعية. فعلى سبيل المثالء تَذّعِي 
الشركة أنها أنتجت تقديرات يومية أفضل مما هو متاح الآن من وكالة الطاقة الدولية 
(IEA)‏ من أجل تخزين النفط في جميع أنحاء bll‏ وقد استطاعت فعل ذلك من خلال 
تحليل صهاريج تخزين النقط حول العام. 

- تتبع شركة Spaceknow‏ للتغيرات في محيط ا مصنع لأكثر من ٠٠٠١‏ موقع مصنع 
صيني. وقد تمكنت الشركة باستخدام هذه البيانات» من تقديم فكرة عن النشاط الاقتصادي 
الصناعي (ual‏ وقد كانت هذه الفكرة أفضل بكثير مما قدمته الحكومة الصينية. 
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- استخدام Descartes Jaleo‏ لبيانات الأقمار الصناعية من أجل التنبؤ بحصاد الذرة 
في الولايات المتحدة بدقة أكبر من وزارة الزراعة الأمريكية. فالتنبؤات الأفضل قد يكون 
لها آثار مالية ضخمة على تداول العقود الآجلة. ومن أقدم الأمثلة على ذلك مثال لإحدى 
الشركات تُسمى Lanworth‏ والتي تنبأت أيضًا بتقديرات محاصيل الذرة. وقد قامت شركة 
Thomson Reuters‏ بشراء شركة Lanworth‏ ثم دمجتها في خدمة Eikon‏ الخاصة بهم. 

- قدرة شركة DigitalGlobe‏ على تحليل حجم الغابة مزيد من الدقة نظرًا لقدرة 
برنامجها على عد كل شجرة في الغابةء مما يؤدي إلى تقدير أكثر دقة نظرًا لأنه لا توجد 
حاجة لاستخدام عينة تمثيلية. 

el -‏ شركة Kensho‏ بالاستفادة من تحليل البيانات من مصادر متعددة (ذُكرت 
سابقًا) من أجل بناء محرك تجاري» وذلك بدعم من شركة „Goldman Sachs‏ 

وقد أعطت هذه الأمثلة مجرد عينة من الطرق التي يمكن بها جمع البيانات من أجل 
إنشاء أفكار جديدة. وبالطبع» فإنه في بعض الحالات يكون هناك بعض المخاوف التي 
تتعلق بالخصوصية. فعلى سبيل «JUL‏ ذكرت صحيفة Wall Street‏ في عام Y YO‏ قصة 
لشركة Yodlee‏ وهي شركة توفر أدوات التمويل الشخصي لعدد من البنوك الكبيرة ومن 
ثم فإن الشركة يمكنها الوصول إلى ملايين من معاملات بطاقات الائتمان الخاصة بالعملاء 
وتقوم ببيع هذه البيانات إلى شركات تحليلات أخرى والتي يمكنها استخدام هذه المعلومات 
من أجل تطوير تنبؤات مبكرة حول كيفية اتجاه المبيعات نحو بائع تجزئة معين. 

وهذه المعلومات مطلوبة بشكل كبير من قبل متعاملي سوق الأوراق المالية. وقد 
أدت هذه القصة إلى حدوث ضجة كبيرة بسبب استخدام المعلومات الخاصة بالعملاء 
بطرق غير مصرح بها. Lo]‏ فإن هناك ÓB‏ في بعض الدوائر حول مشروعية وضع Jia‏ 
هذه التنبؤات المتقدمة حول سلعة معينة أو شركة معينة. وعلى الرغم من أن جميع 
هذه المخاوف سيتم حلها في نهاية المطاف من قبل صانعي السياسات. إلا أنه من الواضح 
أن الطرق الجديدة وامثيرة للاهتمام والتي تُستخدم للجمع بين بيانات الأقمار الصناعية 
والعديد من مصادر البيانات الأخرى ينتج عنها ظهور مجموعة جديدة من شركات 
التحليلات. حيث تعمل جميع هذه المنظمات مع البيانات التي تتوافق مع مواصفات 
الثلاث (V's)‏ وهي تنوع العناصر وحجمها وسرعاتها. وبالإضافة إلى ذلك فإن بعض 
هذه الشركات تعمل أيضًا مع فئة أخرى من البيانات وهي أجهزة الاستشعارء والتي 
سنقوم بمناقشتها في الفصل التالي عندما نستعرض الاتجاهات الناشئة في التحليلات. غير 
أن هذه الشركات تقع ضمن مجموعة من التطبيقات المبتكرة والناشئة. 
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-١‏ ما هو العامل المشترك في الأمثلة التي تناولناها بالمناقشة في هذه الحالة العملية؟ 
-Y‏ هل هكنك التفكير في تدفقات البيانات الأخرى التي قد تساعد في إعطاء دلالة 
مبكرة للمبيعات في متاجر التجزئة؟ 
-Y‏ هل يمكنك التفكير في تطبيقات أخرى Slos‏ الطرق التي تم عرضها في هذه الحالة العملية؟ 
Sources: Dillow, C. (2016). What happens when you combine artificial intelligence‏ 
and satellite imagery. fortune.com/201630/03//facebook-ai-satellite-imagery/‏ 
(accessed July 2016). Ekster, G. (2015). Driving investment performance with‏ 
alternative data. — integrity-research.com/wp-content/uploads/20151 1//Driving-‏ 
Investment-Performance-With-Alternative-Data.pdf (accessed July 2016). Hope, B.‏ 
Provider of personal finance tools tracks bank cards, sells data to investors.‏ .)2015( 
wsj.com/articles/providerof-personal-finance-tools-tracks-bank-cards-sells-data-to-‏ 
investors-1438914620 (accessed July 2016). Orbital Insight. World Oil Storage Index.‏ 
orbitalinsight.com/solutions/world-oil-storage-index/(accessed July 2016). Shaw,‏ 
C. (2016). Satellite companies moving markets. quandl.com/blog/alternative-data-‏ 
satellite-companies (accessed July 2016). Steiner, C. (2009). Sky high tips for crop‏ 
traders. — http://www.forbes.com/forbes/20090907//technology-software-satellites-‏ 
sky-high-tipsfor-crop-traders.htm! (accessed July 2016). Turner, M. (2015). This is‏ 
the future of investing, and you probably can't afford it. businessinsider.com/hedge-‏ 
funds-are-analysing-data-to-get-an-edge-20158- (accessed July 2016).‏ 


أسئلة للمراجعة على القسم ۲-۷: 

-١‏ اذا تعتبر البيانات الضخمة مهمة؟ وما الذي تغير ليتم وضعها في مركز ble‏ التحليلات؟ 

-Y‏ عرّف البيانات الضخمة. lbg‏ يصعب تعريفها؟ 

-Y‏ ما هو أصل "V's"‏ التي تُستخدم لتعريف البيانات الضخمة. وأي منها يعتبر الأكثر أهمية في 
رأيك؟ وماذا؟ 

-٤‏ ما رأيك في مستقبل البيانات الضخمة؟ وهل من الممكن أن تترك شهرتها لشيء آخر؟ وإذا كان 
الأمر UIS‏ فماذا سيكون هذا الشيء؟ 
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P-V‏ أساسيات تحليلات البيانات الضخمة: 
لا قيمة للبيانات الضخمة بحد ذاتها - بغض النظر عن حجم هذه البيانات» أو نوعهاء أو 
سرعتها - مالم يقم مستخدمو الأعمال بعمل شيء ما يعطي قيمة لمنظماتهم. وهنا تظهر في الصورة 
التحليلات ”الضخمة“. وعلى الرغم من قيام المنظمات Gio‏ بتشغيل التقارير ولوحات المعلومات 
ضد مستودعات البيانات» إلا أن معظمها لم يفتح هذه المستودعات لإجراء استكشاف متعمق 
حسب الطلب» وهذا يرجع بشكل جز إلى التعقيد الشديد لأدوات التحليل بالنسبة للمستخدم 
العاديء كما يرجع أيضًا إلى أن المستودعات في الغالب لا تحتوي على جميع البيانات اللازمة 
للمستخدم القوي غير أن كل ذلك على وشك التغيير بطريقة مثيرة (وبالفعل تم تغيير البعض)» 
وذلك بفضل النموذج الجديد لتحليلات البيانات الضخمة. 
وعلى الرغم من عرض قيمة البيانات الضخمة» غير أنها تسببت léif‏ في تحديات كبيرة للمنظمات» 
حيث إن الوسائل التقليدية لالتقاط وتخزين وتحليل البيانات غير قادرة على التعامل بفاعلية 
وكفاءة مع البيانات الضخمة. ولذلك؛ فإن السلالات الجديدة للتقنيات ينبغي تطويرها (أو شراؤها 
/ استخدامها / الاستعانة مصادر خارجية) من أجل مواجهة تحديات البيانات الضخمة. كما ينبغي 
على المنظمات قبل اتخاذ أي خطوات في هذا الاستثمار أن تبين أسباب استخدام مثل تلك الوسائل. 
وفيما يلي نذكر بعض الأمثلة التي قد تساعد في تسليط الضوء على هذه الحالة. واعلم أنك ستكون 
بحاجة للتفكير الجاد في الإبحار في رحلة البيانات الضخمة في حال års‏ إحدى الحالات التالية: 
- إذا كنت لا تستطيع معالجة مقدار البيانات التي تريدها بسبب المحددات المفروضة من 
نظامك الحالي أو البيئة الحالية. 
- إذا كنت تريد تضمين مصادر بيانات جديدة / معاصرة (مثل: وسائل التواصل الاجتماعي» 
dz aod] RFID‏ الويبء GPS‏ البيانات النصية) في منصة البيانات الخاصة بك غير أنك لا 
تستطيع ذلك نظرًا لعدم توافقها مع الصفوف والأعمدة المحددة في مخطط مستودعات البيانات 
دون التضحية بثبات أو ثراء البيانات الجديدة. 
- أن تكون في حاجة إلى (أو ترغب في) دمج البيانات بأسرع ما يمكن لتتوافق مع تحليلاتك. 
- أن تكون لديك رغبة في العمل مخطط حسب الطلب (بدلًا من المخطط المحدد سلقًا والذي 
يُستخدم في أنظمة إدارة قواعد البيانات ذات الصلة ([RDBMSs]‏ لأن طبيعة البيانات الجديدة 
قد لا تكون معروفة, أو قد لا يكون هناك guio‏ من الوقت لتحديد ذلك وتطوير المخطط له. 
- وصول البيانات إلى منظمتك بصورة سريعةء بحيث لا تستطيع منصة التحليلات التقليدية التعامل معها. 
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وكما هو الحال مع أي استثمار كبير في مجال تقنية المعلومات» فإن النجاح في تحليلات البيانات 
الضخمة يعتمد على عدد كبير من العوامل. ويعرض الشكل (£-V)‏ تصويرًا Ls‏ لأكثر عوامل 
النجاح أهمية )2012 (Watson,‏ 














شكل :£-V‏ عوامل النجاح لتحليلات البيانات الضخمة 


وفيما يلي أهم عوامل نجاح تحليلات البيانات الضخمة )& Watson, Sharda,‏ 
(Schrader, 2012‏ 





-١‏ وضوح احتياجات الأعمال (بحيث تتوافق مع الرؤية والإستراتيجية): فالاستثمارات في الأعمال 
ينبغي أن تتم لصالح العملء وليس ممجرد التقدم Jlag‏ التقنية. ولذلك؛ فإنه ينبغي أن 
تكون احتياجات الأعمال هى المحرك الرئيس لتحليلات البيانات الضخمة على كل المستويات: 
الإستراتيجي» والتكتيكيء بالإضافة إلى التشغيلي. 

-Y‏ رعاية قوية. ملتزمة (بطل تنفيذي): فمن ا معروف جيدًا أنه من الصعب (إن لم يكن مستحيكًا) 
تحقيق النجاح» إذا لم يكن لديك رعاية ودعم تنفيذي قوي وملتزم. هذه الرعاية هكن أن 
تكون على مستوى الإدارات» وذلك في حالة إذا كان المدى عبارة عن تطبيق تحليلي فردي أو 
عدد قليل من التطبيقات التحليلية. ومع ذلكء فإنه في حالة ما إذا كان الهدف هو التحول 
التنظيمي على نطاق ا مؤسسة» وهو ما يحدث في كثير من الأحيان مبادرات البيانات الضخمة, 
فينبغي أن تكون الرعاية على أعلى المستويات كما ينبغي أن يكون التنظيم واسع النطاق. 
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-Y‏ التوافق بين الأعمال وإستراتيجية تقنية المعلومات: فمن الضروري التأكد من أن العمل 
التحليلي يدعم Ulo‏ إستراتيجية العمل وليس العكس. وينبغي أن تلعب التحليلات الدور 
التمكيني في تنفيذ إستراتيجية الأعمال بنجاح. 

-E‏ ثقافة guo‏ القرار المبني على الحقيقة: في ثقافة صنع القرار المبني على الحقيقةء يكون الاعتماد 
على الأرقام بدلا من الحدسء أو الشعور الغريزيء أو افتراض عملية guo‏ القرار. وهناك أيضًا 
ثقافة التجريب لمعرفة ما glas‏ ومالا يصلح. ولإنشاء هذه الثقافة تحتاج الإدارة العليا إلى: 
- إدارك أن بعض الأشخاص لا يمكنهم أو لن يقوموا بضبط ذلك. 
- أن تكون Égo sel»‏ 

- التأكيد على ضرورة وقف الأساليب القدهة. 
- أن تطلب معرفة أي التحليلات دخلت في القرار. 
- أن تربط الحوافز والمكافأت بالسلوكيات المرغوبة. 

0- بنية تحتية قوية للبيانات: قدمت مستودعات البيانات البنية الأساسية للبيانات من أجل 
التحليلات. وفي عصر البيانات الضخمة فإن هذه البنية الأساسية يتم تغييرها وتعزيزها 
باستخدام تقنيات جديدة. حيث يتطلب النجاح أن يتم الجمع بين القديم والجديد من أجل 
بنية أساسية شاملة تعمل بصورة تآزرية. 

وتزداد الحاجة إلى أنظمة تحليلية أكثر كفاءة. كلما ازداد الحجم والتعقيد. وقد تم تطوير 
عدد من التقنيات الحسابية والمنصات المبتكرة والجديدة. من أجل مواكبة الاحتياجات الحسابية 
للبيانات الضخمة. وهذه التقنيات مجتمعةً تسمى الحوسبة عالية الأداءء والتي تتضمن ما يلي: 
- تحليلات داخل الذاكرة: وهي تقوم بحل المشاكل المُعقدة فور حدوثها تقريبًا بأفكار عالية 
الدقة من خلال السماح معالجة وتوزيع الحسابات التحليلية والبيانات الضخمة في الذاكرة عبر 
مجموعة مخصصة من العقد. 

- تحليلات داخل قاعدة البيانات: وتعمل على توفير الوقت للأفكار وتمكين إدارة البيانات بشكل 
أفضل من خلال إجراء تكامل للبيانات والوظائف التحليلية داخل قاعدة البيانات بحيث لا 
تضطر إلى نقل البيانات أو تحويلها بشكل متكرر. 

- الحوسبة الشبكية: وتعمل على رفع الكفاءة. وخفض AUKI‏ وتحسين الأداء عن طريق معالجة 
الوظائف بشكل مشترك تتم إدارته مركزيًا من قبل موارد تقنية ا معلومات. 

- الوسائل: يتم الجمع بين الأجهزة والبرامج في وحدة مادية لا تتسم بالسرعة dali‏ بل هي أيضًا 
ab‏ للتطوير على حسب الحاجة. 
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وتمثل المتطلبات الحاسوبية مجرد جزء صغير من d ZB‏ التحديات التي تفرضها البيانات 

الضخمة على مشروعات اليوم. وقد عثر مديرو الأعمال التنفيذيون على تحديات ذات تأثير كبير 

على التنفيذ الناجح لتحليلات البيانات الضخمة. وعند النظر في مشاريع وأساليب بناء البيانات 

dall‏ فإن التنبه لهذه التحديات سوف يجعل رحلة تحليلات الكفاءة أقل إرهافًا. وفيما يلي 

قائمة بهذه التحديات: 

- حجم البيانات: القدرة على gar‏ 25539 3( ومعالجة حجم ضخم من البيانات بسرعة ملائمة 
حيث تكون أحدث المعلومات متاحة لصانعي القرار في حالة حاجتهم إليها. 

- تكامل البيانات: القدرة على الجمع بين البيانات غير متشابهة الهيكل أو المصدر مع مراعاة أن 
يتم عمل ذلك بسرعة وبتكلفة معتدلة. 

- إمكانات المعالجة: القدرة على معالجة البيانات Äe pus‏ بمجرد وجودهاء حيث إن الطريقة 
التقليدية لجمع ومعالجة البيانات رها لا تؤدي العمل المطلوب. ولذلك؛ فإنه في العديد من 
الحالات» ينبغي تحليل البيانات بمجرد الحصول عليها للاستفادة من أكبر قدر ممكن من قيمتها 
(وهذا ما يسمى بتحليلات التيارء والتي سوف نتناولها لاحقًا في هذا الفصل). 

- التحكم في البيانات: القدرة على حفظ الأمنء والسريةء وحقوق الملكيةء وجودة البيانات 
الضخمة. وينبغي أن تتناسب قدرات ممارسة التحكم مع حجم تغيير البيانات» وتنوعها (في 
التنسيق والمصدر)» وسرعتها. 

- توافر المهارات: يتم استغلال البيانات الضخمة من خلال استخدام أدوات جديدة كما يتم البحث 
عنها بطرق مختلفة. وهناك نقص في الأشخاص (الذين يطلق عليهم غالبًا علماء البيانات) ذوي 
المهارات اللازمة للقيام بهذه المهمة. 

- تكلفة الحل: هناك قدرٌ كبيرٌ من التجارب والاكتشافات التي تجري لتحديد أنماط هذه المسألة 
والأفكار التي تتحول إلى قيمة. وذلك بسبب ما قدمته البيانات الضخمة من تحسينات الأعمال 
الممكنة. ولضمان تحقيق عائد إيجابي على الاستثمار في مشروع البيانات الضخمة: فإنه من 
الضروري تقليل تكلفة الحلول المستخدمة لإيجاد تلك القيمة. 

وكما أن التحديات حقيقيةء فإن عرض قيمة تحليل البيانات الضخمة يكون Lal‏ كذلك. وأي شيء 

يمكنك القيام به باعتبارك قائد لتحليل الأعمال من أجل المساعدة في إثبات قيمة مصادر البيانات 

الجديدة بالنسبة إلى الأعمالك سوف ينقل مؤسستك إلى ما هو أكثر من مجرد تجريب واستكشاف 

البيانات الضخمة في تكييفها llis‏ باعتبارها s‏ مختلقًا. ولا يوجد شيء خاطن مع الاستكشافء غير 

أن القيمة db‏ في نهاية المطاف من وضع تلك الأفكار موضع التنفيذ. 
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مشاكل الأعمال التي تم علاجها من خلال تحليلات البيانات الضخمة: 
تتمثل أهم مشاكل الأعمال التي تتم معالجتها عن طريق البيانات الضخمة بوجه عام في 
كفاءة العمليات وتخفيض التكاليفه بالإضافة إلى تعزيز تجربة العملاء غير أنه عندما يتم النظر 
إليها من منظور قطاع الصناعة فإن هناك أولويات مختلفة تظهر. وربما تكون كفاءة العمليات 
وتخفيض التكلفة مصنفة من ضمن المشكلات ذات المستوى الأعلى والتي هكن معالجتها باستخدام 
تحليلات البيانات الضخمة لقطاعات التصنيع» والحكومة. والطاقة والمرافق» والاتصالات والإعلام 
والنقل والرعاية الصحية. كما أن تعزيز تجربة العملاء قد تكون على رأس قائمة المشكلات التي 
تعالجها شركات التأمين. وبالنسبة للشركات في القطاع المصرفي والتعليم فإنه Bale.‏ ما تكون 
إدارة المخاطر على رأس القائمة. وفيما يلي قانمة جزئية با مشاكل التي يمكن معالجتها باستخدام 
تحليلات البيانات الضخمة: 
- كفاءة العملية وخفض التكلفة. 
- إدارة العلامة التجارية. 
- تعظيم العائد, والبيع المتقاطع» والبيع من خلال وسطاء. 
- تجربة العملاء المحسنة. 
- تحديد هوية تحول العملاء والمحافظة على العملاء. 
- خدمة العملاء المحسنة. 
- تحديد المنتجات الجديدة وفرص السوق. 
- إدارة المخاطر. 
- الامتثال للوائح التنظيمية. 
- إمكانات الأمان المحسنة. 
وتضرب الحالة العملية (Y-V)‏ مثالا ممتارًاً للصناعة di pabl‏ حيث يتم تكامل المصادر ا مختلفة 
للبيانات مع البنية الأساسية للبيانات الضخمة من أجل التوصل إلى مصدر واحد للحقيقة. 
حالة عملية ۲-۷ 
بنك توب فايف إنفستمنت (Top Five Investment)‏ يحقق التوصل إلى مصدر 
واحد للحقيقة 
يعتبر فريق مشتقات البنك الذي يحظى بالاحترام الفائق مسؤولًا عن أكثر من ثلث 
إجمالي تجارة المشتقات في العام. كما أن ممارسة هذا الفريق للمشتقات لها بصمة 
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dle‏ في مقابل الفرق التي esas‏ الائتمانء ومعدلات الفائدة. ومشتقات الأسهم في كل 
منطقة من مناطق العام. وقد حصل البنك على العديد من الجوائز في مجال الصناعة 
والمُعتَرف بها لابتكارات منتجاتها. 

التحدي: 

وقد أدركت إدارة البنك بتعرضها للمشتقات المهمة. أهمية وجود رؤية ible‏ 
في الوقت المناسب مواقعها. وقد تألف النظام الحاليء والذي يستند على قاعدة 
بيانات علائقيةء من العديد من المنشآت حول العام. وبسبب التوسعات التدريجية 
من أجل استيعاب تزايد أنواع حجم البيانات» فإن النظام القديم ۾ يكن سريعًا ها 
يكفي ليلبي احتياجات ومتطلبات العمل المتزايدة. حيث م يتمكن هذا النظام من 
تقديم تنبيهات في الوقت المناسب لإدارة السوق والمناصب الائتمانية المناظرة في الإطار 
الزمني المرغوب فيه. 

الحل: 

قام البنك ببناء متجر للمشتقات التجارية flo‏ على MarkLogic‏ (مورد حلول 
تحليلات بيانات ضخمة). لتحل محل التقنيات الحالية. وقد تمكن البنك من معرفة 
وضعه في السوق ووضعه الائتماني في الوقت المناسب» وذلك من خلال استبدال خوادم 
معالجة الدفعات المختلفة العشرين بمخزن تجاري واحد جاهز للتشغيلء مما وفر 
لقدرة على التصرف بسرعة للحد من المخاطر. وقد سمحت دقة واكتمال البيانات 
للبنك وجهاز التنظيم الخاص به. بالاعتماد بشكل واثق على المقاييس ونتائج اختبار 
الضغط التي يقدمها. 

وقد اشتملت عملية الاختيار على ترقية كل من تقنية Oracle‏ وتقنية Sybase‏ 
الحاليتين» بالإضافة إلى الوفاء بجميع المتطلبات التنظيمية الجديدة والذي يعد عاملًا 
رئيسًا في اتخاذ القرار فقد كان البنك يتطلع إلى زيادة استثماراته إلى أقصى حد. وقد كان 
لخيار واضحًا بعد التحقيق الدقيق الذي أجراه البنك» فلم يتمكن أي من الخوادم من 
AL‏ كلا الحاجتين فضلًا عن توفير أداء أفضلء وقابلية gugl‏ وتطوير أسرع للمتطلبات 
المستقبلية والتنفيذية. وتكلفة إجمالية أقل لحقوق ASUI‏ سوى MarkLogic‏ فقط 
والذي استطاع أن يفي بكل ذلك. ويوضح الشكل (0-V)‏ التحويل من الأنظمة المجزأة 
القدهة إلى النظام ا موحد الجديد. 
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(نسخ منفصلة لمغزن تجارة المشتقات) 
بعل : أصبح من الممكن تحليل جميع العقود فى 
قاعدة بيانات منفردة (يقوم خادم 

marklogic 
بازالة الحاجة إلى 20 نسخة من قاعدة البياقات)‎ 

















Sources: MarkLogic. 


شكل :0-V‏ الانتقال من عدة أنظمة قدهة إلى نظام جديد موحد 


النتائج: 

وقع الاختيار على MarkLogic‏ نظرًا U‏ يوفره من تحديث لجزء من الثانيةء بالإضافة 
إلى أوقات الاستجابة للتحليل اللازمة لإدارة سجل تجارة المشتقات بشكل فعال والذي 
يمثل ما يقرب من ثلث السوق العالميء في حين أن النظم الحالية لن تقدم ذلك. والآن 
يتم تجميع البيانات التجارية بدقة من خلال ملف مشتقات البنك بالكاملء مما يسمح 
لأصحاب المصلحة بإدارة المخاطر بمعرفة ملف ا مخاطر الحقيقي للمؤسسة:. لإجراء 
التحليلات التنبؤية باستخدام بيانات دقيقة. ولاعتماد نظرة تطلعية. ولا يقتصر الأمر 
على توفير ola‏ آلاف الدولارات من تكاليف التقنية كل عام بل إن البنك لا يحتاج إلى 
إضافة موارد للوفاء با مطالب المتزايدة للهيئات التنظيمية من أجل مزيد من الشفافية 
وتكرار اختبار الضغط. وفيما يلي أهم العناصر: 

- تعمل ميزة التنبيه على elis]‏ المستخدمين على دراية فورية بتغييرات السوق 
والتغييرات الاثتمانية لنظرائهم حتى يتمكنوا من اتخاذ الإجراءات المناسبة. 

- يتم تخزين المشتقات وتداولها في نظام MarkLogic‏ فردي ولا يتطلب أي توقف 
للصيانةء مما يعطيه ميزة تنافسية كبيرة. 

- يمكن shol‏ تغييرات معقدة خلال ساعات في حين أن الخوادم الآخرى تستغرق 
Ul‏ وأسابيع بل وقد تصل إلى أشهر. 
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- أدى استبدال Sybases Oracle‏ إلى خفض تكاليف العمليات بشكل كبير حيث أنه 
يوفر: نظام واحد مقابل Dli ٠١‏ ومسؤول قاعدة بيانات واحد بدلا من ٠١‏ بالإضافة 
إلى انخفاض تكاليف كل عملية تداول. 

الخطوات التالية: 

gol‏ النجاح في تنفيذ النظام الجديد وأدائه إلى فحص البنك Bel‏ أخرى حيث 
يمكنه أن يستخلص قيمة أكبر من بياناته الضخمة Saal‏ أو غير المهيكلة, و / أو 
المتسلسلة. وهناك تطبيقان قيد اممناقشة النشطة. حيث ترى أعمال أبحاث الأسهم 
الخاصة بهم فرصة لزيادة الإيرادات بشكل كبير من خلال نظام أساسي يوفر الأبحاث في 
الوقت المناسبء كما يوفر إعادة التهيئةء فضلًا عن المحتوى. كما يرى البنك Ls]‏ قوة 
مركزية بيانات العملاء في تحسين الإعداد. وزيادة فرص البيع امتقاطع» ودعم اعرف 
متطلبات عميلك. 

أسئلة للمناقشة: 

-١‏ كيف هكن الاستفادة من البيانات الضخمة في البنوك التجارية على نطاق واسع؟ 

-Y‏ كيف ساعدت البنية الأماسية ل MarkLogic‏ في تسهيل الاستفادة من البيانات الضخمة؟ 

-Y‏ ما هي bas]‏ والحل ابمقترح» والنتائج التي تم التوصل إليها؟ 

investment bank achieves single 0 Top .(Y-YY) .Sources: MarkLogic 
derivativestrading--0-source of truth. marklogic.com/resources/top 


«(Y+ Y1 bank-achieves-single-source-of-truth (accessed July 
:۳-۷ أسئلة للمراجعة على القسم‎ 
ما هي تحليلات البيانات الضخمة؟ وكيف تختلف عن التحليلات المنتظمة؟‎ -١ 
ما هي عوامل النجاح ذات الأولوية لتحليلات البيانات الضخمة؟‎ -Y 
ما هي التحديات الكبيرة التي ينبغي مراعاتها عند اعتماد تنفيذ تحليلات البيانات الضخمة؟‎ -Y 
ما هي مشاكل العمل الشائعة التي تم علاجها بواسطة تحليلات البيانات الضخمة؟‎ -£ 


٠-۷‏ تقنيات البيانات الضخمة: 


هناك عدد من التقنيات بمعالجة البيانات الضخمةء غير أن معظمها لها بعض الخصائص المشتركة 
(Kelly, 2012)‏ وهذا يعني أنهم يستفيدون من الأجهزة السلعية لتمكين أساليب التدريج والتعامل 
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المتوازي؛ واستخدام قدرات مس تودعات البيانات غير الارتباطية لمعالجة البيانات غير المهيكلة وشبه 
المهيكلة؛ وتطبيق تقنية متقدمة للتحليلات والتصوير البصري SLL‏ الضخمة من أجل نقل الأفكار إلى 
ا مستخدمين النهائيين. وتتمثل تقنيات البيانات الضخمة الثلاثة البارزة في .MapReduce‏ وم112000 و 
NoSQL‏ والتي يُعتقد أنها على الأغلب سوف تحول تحليلات الأعمال وأسواق إدارة البيانات. 


:MapReduce 
أسلويًا مفضلًا عن طريق جوجلء والذي يقوم بتوزيع معالجة ملفات البيانات‎ MapReduce يُعد‎ 
الضخمة متعددة الهيكلة عبر مجموعة كبيرة من الآلات. ويتم تحقيق الأداء العالي عن طريق تقسيم‎ 
المعالجة إلى وحدات صغيرة من العمل التي يمكن تشغيلها بالتوازي عبر المئات» بل قد تكون عبر الآلافء‎ 

من العقد في مجموعة الآلات تلك. وفيما يلي اقتباس الوثيقة المهمة المتعلقة ب :MapReduce‏ 
إن MapReduce‏ هو فموذج برمجة وتنفيذ مترابط بلعالجة وتوليد مجموعات 
البيانات الضخمة. حيث تتم موازنة البرامج المكتوبة على هذا النمط الوظيفي تلقائيًا 
وتنفيذها على مجموعة كبيرة من آلات المادة. الجدير بالذكر أن استخدام مثل هذه 
الأنظمة المتوازية والموزعة يسمح للمبرمجين الذين ليس لديهم أي خبرة بالاستفادة 
بسهولة من موارد نظام التوزيع الكبير. )2004 Dean & Ghemawat,‏ 
وتتمثل النقطة الأساسية التي ينبغي ملاحظتها من هذا الاقتباس في أن MapReduce‏ يُعد 
نموذج برمجةء وليس لغة برمجةء وهذا يعني أنه مصمم ليتم استخدامه من قبل المبرمجين» وليس 
مستخدمي الأعمال. ولوصف كيفية عمل MapReduce‏ بأسهل dii b‏ سنقوم بضرب مثال. 
انظر عداد المربعات الملونة ColoredSquare‏ في الشكل (1-۷). 
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دالة التقليل دالة الخريطة بيانات خام 





شكل I-V‏ تصوير بياني لعملية Mapreduce‏ 
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لاحظ في هذا الشكل أن المدخلات إلى عملية MapReduce‏ هي عبارة عن مجموعة من 
المربعات اللملونة. والهدف هو حساب عدد مربعات كل لون. وفي هذا المثال يكون المبرمج 
مسؤولًا عن ترميز الخريطة والتقليص من البرامج؛ وما يتبقى من المعالجة يتم التعامل معها من 
خلال نظام البرمجيات الذي ينفذ تموذج برمحة -MapReduce‏ 

حيث يقوم نظام Vs] MapReduce‏ بقراءة ملف المدخلات وتقسيمه إلى عدة أجزاء. وفي هذا 
JEL‏ هناك oleg‏ من التقسيمات» بينما على أرض الواقع؛ ole‏ ما يكون عدد التقسيمات أعلى من 
ذلك بكثين ومن تم تتم معالجة هذه التقسيمات عن طريق برامج map‏ المتعددة والتي تعمل 
بالتوازي على عقد المجموعة. وفي هذه الحالة يكون دور كل برنامج هو تجميع وتقسيم البيانات 
حسب اللونء ثم يقوم نظام MapReduce‏ بأخذ مخرجات كل برنامج ودمج (خلط / فصل) نتائج 
المدخلات إلى برنامج التقليص, والذي يقوم بحساب مجموع عدد المربعات لكل لون. JEL lia ds‏ 
يتم استخدام نسخة واحدة فقط من برنامج التقليصء غير أنه من الناحية العملية قد يكون هناك 
المزيد من النُسخ. وهكن للمبرمجين توفير برنامج الخلط / الفصل الخاص بهم» من أجل تحسين الأداء 
كما يمكنهم Lá‏ نشر أداة الدمج التي تجمع بين ملفات مخرجات الخريطة المحلية؛ وذلك لتقليل عدد 
ملفات المخرجات التي يجب الوصول إليها عن بُعد عبر المجموعة عن طريق خطوة الخلط / الفصل. 
لماذا يُستَخدّم $MapReduce‏ 

يقوم MapReduce‏ بمساعدة المنظمات في معالجة وتحليل كميات كبيرة من البيانات متعددة 
المراحل. وتنطوي أمثلة التطبيق على الفهرسة والبحثء والتحليلات البيانية وتحليلات النصء 
وتعلم الآلةء وتحويل البيانات وهكذا. Weg‏ ما تكون هذه الأنواع من التطبيقات صعبة التنفيذ 
باستخدام SQL‏ القياسية المستخدمة بواسطة DBMSS‏ العلائقية. 

إن طبيعة MapReduce‏ الإجرائية تجعله سهل الفهم بواسطة المبرمجين ذوي المهارة. كما 
أنه أيصًا له ميزة أخرى وهي أن المطورين ليسو مُلرّمين بالاهتمام بتنفيذ الحوسبة المتوازية, 
حيث يتعامل النظام مع هذا الأمر بشفافية. وعلى الرغم من أن MapReduce‏ تم تصميمه من 
أجل المبرمجينء إلا أن غير المبرمجين يمكنهم Lái‏ استغلال قيمة كل من تطبيقات MapReduce‏ 
ومكتبات الوظائف. وتتوفر مكتبات MapReduce‏ سواء المدفوعة أو المجانية والتى توفر نطاقًا 
واسعًا من القدرات التحليلية. فعلى سبيل JÈL‏ نجد أن مكنبة Apache Mahout‏ هى مكتبة 
تعلم آلي مجانية ل ”خوارزميات التجميع والتصنيف والترش يح التعاوني المستند إلى الدفعة“ التي 
يتم تنفيذها باستخدام -MapReduce‏ 
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, o? ; :Hadoop 


Sace Hadoop. 

يعتسبر Hadoop‏ إطار عمل مجاني dL adlah‏ وتخزينء وتحليل كميات ضخمة من البيانات 
المتفرقة وغير المهيكلة. وقد تم إنشاء Hadoop‏ في البداية من قبل Doug Cutting‏ على :Yahoo‏ 
وقد تم استخلاص فكرة تقنية Hadoop‏ من MapReduce‏ والذي هو عبارة عن دالة محددة 
بواسطة المستخدم ومطورة بواسطة جوجل في بدايات الألفية الثانية من أجل فهرسة الويب. وقد 
تم تصميمه للتعامل مع البيتابايتس والإكسابايتس الخاصة بالبيانات التي تم توزيعها عبر عقد 
متعددة في نفس الوقت. وتعمل مجموعات Hadoop‏ على أجهزة مواد غير مُكلقّة بحيث يمكن 
توسيع نطاق المشرعات دون اللجوء للبنك. وقد أصبح Hadoop‏ الآن مشروعًا لتأسيس برمجيات 
أباتشي «Apache Software Foundation‏ حيث يعمل المئات من الملساهمين باستمرار على 
تحسين التقنية الأساسية. وتتمثل الفكرة الأساسية في: قيام Hadoop‏ بتجزئة البيانات الضخمة 
إلى أجزاء متعددة بحيث يمكن معالجة كل جزء وتحليله في نفس الوقتء بدلا من كثرة التخبط 

في مجموعة ضخمة من البيانات باستخدام جهاز واحد. 


كيف يعمل Hadoop‏ 


يقوم العميل بالوصول إلى البيانات غير المهيكلة وشبه المهيكلة من المصادر ا في ذلك ملفات 
السجلء وإشعارات وسائل التواصل الاجتماعي» ومخازن البيانات الداخلية» ثم يقوم بتقطيع البيانات 
إلى «el ob‏ وهذه الأجزاء يتم تنزيلها بعد ذلك في نظام ملفات cà Js‏ من عُقد متعددة تعمل 
على أجهزة مادية. وأما مخزن الملفات الافتراضي في Hadoop‏ فهو نظام ملفات Hadoop‏ المُقّسمة 
Hadoop Distributed File System‏ أو .HDFS‏ ومن الجدير بالذكر أن أنظمة الملفات مثل 
نظام 11215 هي أنظمة بارعة في تخزين كميات ضخمة من البيانات غير المهيكلة وشبه المهيكلة 
نظرًا لأنها لا تتطلب تنظيم البيانات في الصفوف والأعمدة العلائقية. حيث يتم نسخ كل «eye»‏ 
Bae‏ مرات ثم يتم تنزيله في نظام الملفات بحيث إذا سقطت SI‏ يكون هناك عُقدة أخرى لديها 
نسخة من البيانات الموجودة على العقدة التي سقطت. وتعمل عُقدة الاسم كمسهلء فهي ترجع إلى 
معلومات العميل مثل dol sisli‏ حيث تتواجد بيانات معينة في المجموعة» والعْقد التي سقطت. 

وبمجرد تنزيل البيانات في المجموعة: فإنها تكون جاهزة للتحليل من خلال إطار عمل -MapReduce‏ 
ويقوم العميل باختيار وظيفة "Map"‏ - وعادةً ما تكون عبارة عن استعلام مكتوب بلغة Java‏ - 
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إلى إحدى عُقد المجموعة وا معروفة على أنها متعقب الوظائف. حيث يشير متعقب الوظائف إلى 
Bake‏ الاسم لتحديد البيانات التي يحتاج إليها للوصول إلى JUS]‏ هذه الوظيفة والمكان الموجود في 
المجموعة التي توجد فيها البيانات. وعند تحديد ذلك يقوم مُتَعَقب الوظائف بإرسال الاستعلام إلى 
a sl‏ ذات الصلة. وبدلًا من إعادة إدخال جميع البيانات إلى موقع مركزي من أجل ndis!‏ فإن 
المعالجة تحدث في كل عُقدة في وقت واحد أو بشكل متواز. وهذه سمة أساسية خاصة ب -Hadoop‏ 
Ladies‏ تنتهي كل عقدة من معالجة مهمتها. فإنها تقوم بتخزين النتائج. ويقوم العميل 
بوظيفة ”التقليص“ من خلال متعقب الوظائف حيث يتم تجميع نتائج مرحلة الخريطة المخزنة 
داخليًا على العقد الفردية لتحديد «الإجابة» على الاستعلام الأصليء وعندئذ يتم تنزيلها على عقدة 
أخرى في المجموعة. وبوصول العميل إلى هذه النتائج والتي يمكن تنزيلها بعد ذلك في واحدة 
من العديد من البيئات التحليلية من أجل تحليلها. تكون وظيفة MapReduce‏ قد اكتملت. 
ومجرد أن تكتمل مرحلة MapReduce‏ فإن البيانات المعالجة تصبح جاهزة لإجراء المزيد 
من التحليلات بواسطة علماء البيانات وغيرهم من أصحاب المهارات المتقدمة لتحليل البيانات. 
حيث يستطيع علماء البيانات التحكم فيها وتحليلها مستخدمين أي عدد من الأدوات لأي عدد 
من المرات» Le‏ في ذلك البحث عن الأفكار والأماط الخفيةء أو استخدامها كأساس لبناء تطبيقات 
تحليلية تواجه المستخدم. كما يمكن LÉ‏ تصميم البيانات lalis‏ من مجموعات Hadoop‏ 
إلى قواعد البيانات العلائقيةء ومستودعات البيانات» وأنظمة تقنية المعلومات التقليدية الأخرى 
لإجراء مزيد من التحليل و / أو لدعم معالجة المعاملات. 
مكونات Hadoop‏ الفنية: 
تتكون ”حزمة“ Hadoop‏ من عدد من المكونات» والتي تشمل: 
- نظام ملفات Hadoop‏ المقسمة :(HDFS)‏ وهي طبقة التخزين الافتراضية في أي مجموعة 
محددة من مجموعات .Hadoop‏ 
- عقدة الاسم: وهي العقدة في مجموعة Hadoop‏ التي توفر معلومات العميل فيما يتعلق بمكان 
مستودعات البيانات الخاصة بالمجموعة وما يتعلق بحالة ما إذا فشلت إحدى العقد. 
- العٌقدة الثانوية: وهي نسخة احتياطية من اسم adsl‏ ففيها يتم إجراء hid‏ متماثل بشكل 
دوري ومستودعات البيانات من عقدة الأسماء في حالة فشلها. 
- مُتعقب الوظائف: وهو عبارة عن العَقدة في مجموعة Hadoop‏ والتي تقوم بافتتاح وتنسيق 
وظائف MapReduce‏ أو بمعالجة البيانات. 
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- العقد التابعة: وهي العمق الخاص باي مجموعة Hadoop‏ وتقوم العقد التابعة مستودعات 
البيانات واتخاذ التوجيه لمعالجتها من متعقب الوظائف. 

وبالإضافة إلى هذه المكونات» فإن النظام البيئي Hadoop‏ يتكون من عدد من المكونات 
الفرعية التكميلية. فهناك مخازن البيانات NoSQL‏ مثل HBases Cassandra‏ والتي تُستخدم 
أيضَا لتخزين نتائج وظائف dlg -Hadoop $ MapReduce‏ جانب Java åd‏ فإن هناك لغة 
Pig‏ وهي لغة متاحة مجانًا ومصممة خصيضًا من أجل CENA Hadoop‏ لكتابة بعض 
MapReduce cà 5lbs‏ والوظائف الأخرى ل .Hadoop‏ كما أن هناك Hive‏ وهو عبارة عن 
مستودع بيانات مجاني يسمح بالنمذجة التحليلية داخل Hadoop‏ وقد تم تطويره في الأصل 
بواسطة „Facebook‏ وفيما يلي مكونات Hadoop‏ الفرعية الأكثر شيوعًا. 

HIVE :Hive‏ هو عبارة عن إطار عمل لمستودعات البيانات القائم على Hadoop‏ وقد تم 
تطويره من قبل Facebook‏ وهو يسمح للمستخدمين بكتابة الاستعلامات بلغة مثل SQL‏ وتسمى 
HiveQL‏ والتي يتم تحويلها بعد ذلك إلى MapReduce‏ مما يسمح SQL (xod‏ الذين ليس 
لديهم خبرة ب MapReduce‏ باستخدام المستودع وجعله أسهل لدمجه مع ذكاء الأعمال وأدوات 
التمثيل المرئي مثل: Revolutions Analytics; Tableau .Microstrategy‏ وغير ذلك. 

©: وهي عبارة عن لغة استعلام قائمة على Hadoop‏ تم تطويرها بواسطة Yahoo‏ وهي 
سهلة التعلم نسبيًا كما أنها بارعة في امتدادات البيانات الطويلة I>‏ والعميقة للغاية (حدود SQL‏ 

15 إن HBASE‏ هي قاعدة بيانات غير علائقية تتيح عمليات بحث سريع في 
برنامج Hadoop‏ في وقت قليل» كما أنها تضيف إمكانيات المعاملات إلى Hadoop‏ مما يسمح 
للمستخدمين بإجراء التحديثات» وعمليات الحذف والإضافة. ويستخدم كل من eBay‏ و 
Facebook‏ قاعدة بيانات HBASE‏ بكثرة. 

:FLUME‏ وهو إطار عمل لتغذية Hadoop‏ بالبيانات. حيث يتم ملء كل مكان في البنية 
الأساسية لتقنية المعلومات تقنية المعلومات بالعملاء - داخل خوادم الويب» وخوادم التطبيقات» 
وأجهزة الجوال - على سبيل امثال: لجمع البيانات ودمجها في -Hadoop‏ 

:OOZIE‏ وهو نظام معالجة سير العمل الذي يسمح للمستخدمين بتحديد سلسلة من 
الوظائف المكتوبة بلغات متعددة مثل Pigg MapReduce‏ وع#119ومن ثم ربطها ببعضها 
البعض بذكاء. حيث يتيح Oozie‏ للمستخدمين تحديد أشياء. مثل: أنه لايتم طلب استعلام 
خاص إلا بعد انتهاء الوظائف السابقة المحددة التي يعتمد عليها من أجل البيانات. 
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Apache وهي مجموعة من الأدوات التي تعتمد على الويب لنشر مجموعات‎ :AMBARI 
وإدارتهاء ومراقبته ا. ويقوم بقيادة تطويرها مهندسون من شركة هورتنورك‎ Hadoop 
منصة بيانات هورتنورك الخاصة بها.‎  Ambari والتي تشتمل على‎ (Hortonworks) 

:AVRO‏ وهو نظام تسلسل البيانات الذي يسمح بترميز مخطط ملفات Hadoop‏ وهو 
بارع في تحليل البيانات والقيام بإزالة استدعاءات الإجراءات. 

:MAHOUT‏ وهي مكتبة للتنقيب في البيانات» وهي تستخدم أكثر خوارزميات جمع البيانات انتشارًا 
للقيام بالتجميع, واختبار الانحدار, والنمذجة الإحصائية, وتنفيذ كل ذلك باستخدام نموذج „MapReduce‏ 

:SQOOP‏ وهو أداة اتصال لنقل البيانات من مخازن بيانات غير Jis - Hadoop‏ قواعد 
البيانات العلائقية ومستودعات البيانات - إلى Hadoop‏ وهو يسمح للمستخدمين بتحديد موقع 
الهدف داخل Hadoop‏ فضلًا عن إرشاد م5000 لنقل البيانات من Oracle‏ أو تيراداتاء أو غيرها 
من قواعد البيانات العلائقية إلى الهدف. 

:H ©‏ وهى عبارة عن إدارة مركزية للبيانات الوصفية metadata‏ ومشاركة 
الخدمات ل «Apache Hadoop‏ وهي تسمح برؤية موحدة لجميع البيانات في مجموعات 
Hadoop‏ كما تتيح أدوات متنوعة تتضمن YS‏ من Hives Pig‏ معالجة أي عناصر بيانات دون 
الحاجة إلى معرفة مادية بمكان مستودعات البيانات في ا مجموعات. 


:Hadoop‏ الإيجابيات والسلبيات: 

تتمثل الميزة الأساسية ل Hadoop‏ في أنه يسمح للمشاريع بمعالجة وتحليل كميات كبيرة 
من البيانات غير المهيكلة وشبه المهيكلة» والتي يتعذر الوصول Lad]‏ حتى OI‏ بطريقة فعالة 
من حيث التكلفة والوقت. ونظرًا لأن مجموعات Hadoop‏ يمكنها الوصول إلى البيتابايتس 
وحتى الإكسابايتس من البيانات» فإن المشاريع لم تعد بحاجة إلى الاعتماد على مجموعات عينات 
البيانات ولكن هكنها معالجة وتحليل كل البيانات ذات الصلة. وهكن لعلماء البيانات تطبيق 
تدخل الحلقات التكرارية. حيث إن تنقيح واختبار الاستعلامات باستمرار يؤدي إلى الكشف عن 
أفكار لم تكن معروفة مسبقًا. Lá‏ من مميزات Hadoop‏ أن البدء في استخدامه Y‏ يحتاج إلى 
تكلفة عاليةء بالإضافة إلى أن المطورين يمكنهم تنزيل تقسيمات Apache Hadoop‏ مجانًا والبدء 
بتجريب Hadoop‏ في أقل من يوم واحد. 

أما السلبيات الخاصة ب Hadoop‏ ومكوناته المتعددة فهي تتمثل في أنه لم يصل إلى مرحلة 
النضج كما أنه لازال في تطور حتى الآن. وكما هو الحال مع أي تقنية ناشئة وغير ناضجةء OB‏ 
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تنفيذ وإدارة مجموعات Hadoop‏ بالإضافة إلى إجراء تحليلات متقدمة على كميات ضخمة من 
البيانات غير المهيكلة يتطلب yd‏ ومهارةً وتدريبًا le‏ ولسوء الحظء فإنه في الوقت الحالي 
هناك ندرة في مطوري Hadoop‏ وعلماء البيانات» مما يجعل الحفاظ على مجموعات Hadoop‏ 
المعقدة والاستفادة منها Baf‏ ليس lae‏ وبالإضافة إلى «US‏ فإنه مع تحسين مكونات Hadoop‏ 
العديدة في ا مجتمع» وتكوين المكونات الجديدة فإن هناك خطورة من التفرع وذلك كما هو 
الوضع مع أي تقنية / منهج مجاني غير ناضج. وف النهايةء فإن Hadoop‏ هو عبارة عن Jb!‏ 
موجه بالدفعات» بمعنى أنه لا يدعم معالجة وتحليل البيانات بشكل فوري. 

والمفاجأة السارة أن بعض ألمع العقول في مجال تقنية المعلومات يساهمون في مشروع Apache‏ 
Hadoop‏ وفضلًا عن ذلك فإن هناك Ihas Ío‏ من مطوري Hadoop‏ ومن علماء البيانات ممن هم 
في مقتبل العمر. ونتيجة لذلك؛ تتقدم التقنية بسرعة لتصبح أكثر قوة وأسهل في التنفيذ والإدارة. وأما 
النظام البيئي للموردينء فإنه يتمثل في عمل كل من Hadoop-focused‏ والشركات حديثة الظهور 
مثل Hortenworkss Cloudera‏ والشركات الرائدة في تقنية المعلومات مثل أي (IBM) el à‏ 
ومايكروسوفت (Microsoft)‏ وتيراداتا (Teradata)‏ وأوراكل (Oracle)‏ لتقديم كل من توزيعات 
Hadoop‏ الجاهزة للشركات, والأدوات» والخدمات التجارية وذلك لجعل نشر التقنيات وإدارتها واقعًا 
las‏ للمؤسسة التقليدية. وتعمل الشركات الناشئة الأخرى والتي هي في مقدمة التقنية, على تحسين 
مخزون البيانات NoSQL‏ (ليس فقط (SQL‏ القادر على تقديم أفكار قريبة فوريًا مع “Hadoop‏ 
وتقدم رؤية فنية (V-V)‏ بعض الحقائق لتوضيح بعض المفاهيم الخاطئة حول -Hadoop‏ 

رؤية فنية v-v‏ 
توضيح بعض الحقائق الغامضة الخاصة بهادوب 

على الرغم من وجود هادوب والتقنيات المرتبطة به منذ أكثر من O‏ سنوات» لازال معظم التاس 
يؤمنون ببعض الطفاهيم الخاطئة حول هادوب والتقنيات المرتبطة به مثل: „Hives MapReduce‏ 
وسوف تقدم القائمة التالية والتي تتكون من ٠١‏ حقائق توضيحًا لماهية هادوب وما يقوم به بالنسبة 
إلى ذكاء الأعمالء وكذلك حالات الأعمال والتقنية التي بإمكانها الاستفادة من ذكاء الأعمال ومستودعات 
البيانات والتحليلات القائمة على هادوب )2013 (Russom,‏ 

الحقيقة # cà Jio :١‏ هادوب من برامج متعددة. دائمًا ما نتحدث عن هادوب كما لو أنه برنامج 
واحد مترابط» في حين أنه في الواقع عبارة عن عائلة من المنتجات والتقنيات dated!‏ والتي تشرف عليها 
مؤسسة برنامج (ASF) Apache‏ وتتوفر بعض منتجات هادوب Lá‏ من خلال توزيعات الموردين؛ 
وسيتم تقديم المزيد عن ذلك لاحقًا. 
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وتشمل مكتبة Apache Hadoop‏ (في ذكاء الأعمال حسب الأولوية). VS‏ من :MapReduces HDFS‏ 
Zookeeper Pigg .Hbases «Hives‏ بالإضافة إلى Hues .Oozies Sqoops Flume‏ وما إلى ذلك. 
والتي ممكنك دمجها بطرق de gizo‏ غير sie) MapReduces HDFS ol‏ دمجهم مع (Hives Hbase‏ 
قد يشكلان حزمة تقنية مفيدة لكل التطبيقات في ذكاء الأعمالء ومستودعات البياناتء والتحليلات. 

الحقيقة # :Y‏ يتوفر هادوب مجانًا ومفتوح المصدر لكنه متاح Lad‏ من قبل الموردين. حيث 
إن مكتبة برامج Apache Hadoop‏ المجانية تكون متاحة من ASF‏ على .apache.org‏ وبالنسبة 
للمستخدمين الذين يرغبون في الحصول على حزمة أكثر جاهزية للمؤسسةء فإن عددًا YLIS‏ من الموردين 
GI‏ يقدمون تقسيمات هادوب التي تتضمن أدوات إدارية إضافية És Kess‏ 

الحقيقة # ۴: يعد هادوب نظامًا dt‏ وليس منتجًا مستقلًا؛ إذ يشتمل نظام هادوب البيئي على 
قائمة متزايدة من برامج الموردين التي تتكامل مع أو تنشر تقنيات هادوبء ولن تحتاج لأكثر من دقيقة 
واحدة على محرك بحثك المفضل لتكتشف ذلك. 

الحقيقة # :٤‏ يعتبر HDFS‏ نظام ملفاتء وليس نظام إدارة قاعدة بيانات (DBMS)‏ ويُعد هادوب 
نظام ملفات مقسمة في اللقام الأولء ويفتقر إلى القدرات التي يمكننا ربطها بنظام DBMS‏ مثل الفهرسة 
والوصول العشوائي إلى البيانات» والدعم ل liag .SQL‏ جيد. نظرًا لأن نظام HDFS‏ يقوم بأشياء لاتستطيع 
قواعد البيانات العلائقية (DBMSs)‏ القيام بها. 





الحقيقة # 0: يتشابه Hive‏ مع SQL‏ ولكنه ليس هو SQL‏ القياسي. ويقصر العديد منا نفسه على 
SQL‏ وذلك نظرًا لمعرفتنا الجيدة به بالإضافة إلى أن أدواتنا تتطلب ذلك. وبالنسبة ممن يعرفون لغة 
SQL‏ فإنهم يستطيعون تعلم الرمز اليدوي dde o Hive‏ غير أن هذا لا يحل مشكلات التوافق مع 
الأدوات القائمة على SQL‏ 

الحقيقة # 1t‏ هناك ارتباط بين هادوب MapReduces‏ غير أن هذا الارتباط لا يقتضي أن يحتاج كل 
منهما للآخر. وقد قام المطورون على جوجل بتطوير MapReduce‏ قبل وجود HDFS‏ وهناك بعض 
أشكال MapReduce‏ التي تعمل مع مجموعة متنوعة من تقنيات التخزين. ها في ذلك HDFS‏ وأنظمة 
colalll‏ الأخرى: وبعض .DBMSS‏ 

الحقيقة # :V‏ يوفر MapReduce‏ التحكم في التحليلات» وليس التحليلات في حد ذاتها؛ حيث إن MapReduce‏ 
هو محرك تنفيذ أغراض عامة والذي يتعامل مع تعقيدات الاتصال بالشبكة. والبرمجة المتوازية. واحتمال الخطأ 
لأي نوع من التطبيقات التي يمكنك من خلالها تقديم رمزء وليس مجرد تحليلات. 

الحقيقة ۸#: يدور هادوب حول تنوع OLLI‏ وليس فقط حول حجم البيانات. فمن الناحية 
do JUI‏ هكن لنظام HDFS‏ إدارة التخزين والوصول إلى أي نوع من البيانات blb‏ يمكنك وضع البيانات 
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في ملف ونسخ هذا الملف إلى -HDFS‏ ونظرًا لأن هذا الأمر يبدو بسيطًا للغايةء كما أنه صحيح بصفة 
dole‏ فهذا هو ما يجذب العديد من المستخدمين ل „Apache HDFS‏ 

الحقيقة # 9: يعمل هادوب كمكمل لمستودعات البيانات؛ ونادرًا ما يكون بديلًا عنه. فقد صممت 
معظم المنظمات مستودعات البيانات الخاص بها من أجل البيانات المهيكلة. والعلائقية مما يجعل 
من الصعب حصر قيمة ذكاء الأعمال من البيانات غير المهيكلة وشبه المهيكلة. ويقوم هادوب بتكميل 
مستودعات البيانات من خلال التعامل مع أنواع البيانات متعددة الهياكل والتي لا تستطيع معظم 
مستودعات البيانات (DWs)‏ التعامل معها. 

الحقيقة # :٠١‏ يتيح هادوب أنواعًا عديدة من التحليلات. وليس فقط تحليلات الويب. فعلى الرغم 
من أن هادوب يقع عليه الكثير من الضغوط حول كيفية استخدام شركات الإنترنت له من أجل تحليل 
سجلات الويب وبيانات الويب الأخرىء إلا أنه توجد حالات أخرى يُستخدم فيها. فعلى سبيل «JULI‏ 
تأمل البيانات الضخمة التي b‏ من أجهزة الاستشعارء مثل: الروبوتات في التصنيع. أو RFID‏ في بيع 
التجزئة. أو مراقبة الشبكة في المرافق العامة. كما هكن للتطبيقات التحليلية القديمة التي تحتاج إلى 
عينات كبيرة من البيانات - Jis‏ 15523 قاعدة العملاءء والكشف عن الغشء وتحليل المخاطر - أن تستفيد 
من البيانات الضخمة الإضافية التي يديرها هادوب. وبالمثلء فإنه هكن لبيانات هادوب الإضافية أن 
توسع نطاق المشاهدات ٠١‏ درجة من أجل إنشاء عرض أكثر اكتمالًا ودقة. 


:NoSQL 


ظهر نمط جديد من قاعدة البيانات ذات الصلة يسمى NOSQL‏ (ليس (SQL Ja. äs‏ وهو مثل 
هادوب» حيث يعالج كميات ضخمة من البيانات متعددة الهياكل. ومع ذلك فإنه في الوقت الذي يعد 
فيه هادوب بارعًا في دعم التحليلات التاريخية على نطاق guls‏ فإن قواعد بيانات NoSQL‏ موجهة في 
معظمها (على الرغم من أن هناك بعض الاستثناءات (Aaa‏ لتقديم بيانات منفصلة مخزنة بين كميات 
ضخمة من البيانات متعددة المراحل للمستخدم النهائي وجعل تطبيقات البيانات الضخمة آلية. وتفتقر 
هذه الإمكانية بشدة إلى تقنية قواعد البيانات العلائقية» وهذا يجعلها ببساطة Y‏ تستطيع الحفاظ على 
مستويات أداء التطبيقات المطلوبة في مقياس البيانات الضخمة. 

HBase JU] وهادوب معًا في نفس الوقت. فعلى سبيل‎ NoSQL بعض الحالات» يعمل كل من‎ s 
والتي غالبًا ما يتم نشرها‎ Google BigTable منتشرة على غرار‎ NoSQL المذكورة آنقاء هي قاعدة بيانات‎ 
من أجل توفير عمليات بحث سريعة في هادوب‎ Hadoop ونظام الملفات المقسمة‎ HDFS على رأس‎ 
ACID تتعامل مع‎ lil اليوم في‎ NoSQL قواعد بيانات‎ ghab في وقت قليل. ويتمثل الجانب السلبي‎ 
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(الانسيابية atomicity‏ والاتساق «consistency‏ والانعزال (durability ukla ásolation‏ الالتزام 
بالأداء وقابلية التوسع. كما يفتقر الكثير منها إلى وجود أدوات الإدارة والرصد الناضجة. ويتم التغلب 
على القصور في هذين الجانبين السلبيين بواسطة مجموعات .70501 المجانية ومجموعة من الموردين 
الذين يحاولون تسويق قواعد بيانات NoSQL‏ المختلفة. وتشتمل قواعد بيانات NoSQL‏ المتاحة 
حاليًا على .Accumulos .MongoDBs .Cassandras .HBase‏ بالإضافة إلى «CouchDB; Riak‏ و 
.DynamoDB‏ وغيرها. وتعرض الحالة العملية (Y-V)‏ استخدام قواعد بيانات NoSQL‏ في eBay‏ كما 
توضح Ilodi‏ العملية (£-V)‏ تطبيقًا للتواصل الاجتماعي حيث تم استخدام البنية الأماسية لهادوب 
لتجميع مجموعة من الرسائل على تويتر لفهم أي أنواع المستخدمين الذين يشاركون في أي نوع من 
الدعم لمرضى الرعاية الصحية الذين يبحثون عن معلومات حول الأمراض العقلية المزمنة. 
dli‏ عملية Y-V‏ 
حل البيانات الضخمة الخاص ب eBay‏ 
eBay asi‏ هو أكبر سوق على الإنترنت في العام مما يتيح شراء وبيع أي شيء las‏ 
وقد تأسس هذا السوق في عام M0‏ حيث يربط eBay‏ بين أفراد مجتمع متنوع 
وتفاعلي من البائعين وا مش ترينء فضلًا عن الشركات الصغيرة. الجدير بالذكر أن eBay‏ 
الجماعي له تأثير مذهل على التجارة الإلكترونية: فقد بلغت القيمة الإجمالية للسلع 
المباعة على موقع eBay‏ نحو ۷٥,٤‏ مليار دولار في عام .7١117‏ ويقدم موقع eBay‏ 
خدمات لأكثر من ۱۱۲ مليون مستخدم نشط كما يقدم أكثر من ٠٠١‏ مليون عنصر للبيع. 
التحدي - دعم البيانات على نطاق واسع: 
تعد قدرة eBay‏ على تحويل كميات ضخمة من البيانات التي تنتجها إلى أفكار 
مفيدة GR‏ عملاءها من استخلاصها مباشرة من الصفحات المتكررة. هي أحد مفاتيح 
نجاحه الاستثنائية. ولاستيعاب النمو الضخم في بيانات eBay‏ - فإن مراكز البيانات 
التابعة له تقوم بأداء المليارات من القراءات والكتابات كل يوم - وبسبب زيادة الطلب 
على معالجة البيانات بسرعات Ale‏ فقد احتاج موقع eBay‏ إلى حل ليس له اختناقات 
مثيلة» بالإضافة إلى أنه قابل «x sU‏ وقيود المعاملات المرتبطة بنهج قواعد البيانات 
العلائقية الشائعة. LAT‏ فقد كانت الشركة بحاجة إلى إجراء تحليل سريع على تشكيلة 
واسعة من البيانات المهيكلة وغير المهيكلة التي تم التقاطها. 
الحل - البيانات الفورية المتكاملة والتحليلات: 
إن متطلبات البيانات الضخمة جعلت eBay‏ ينتقل إلى تقنيات NoSQL‏ وتحديدًا 
.DataStax Enterprises Apache Cassandra‏ وقد انجذب eBay‏ أيضًا إلى تحليلات 
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Apache Hadoop‏ المدمجة .DataStax Enterprise ga‏ إلى جانب Cassandra‏ التي 
تتميز بياناتها بالفئة عالية السرعة. وينطوي الحل على بنية تدريجية تجعل eBay‏ 
قادرًا على نشر مجموعات من DataStax Enterprise‏ المتعددة عبر عدة مراكز بيانات 
مختلفة باستخدام الأجهزة السلعية. والنتيجة النهائية هي أن موقع eBay‏ أصبح الآن 
قادرًا على معالجة كميات هائلة من البيانات بكفاءة عالية من حيث AUKI‏ وبسرعات 
عالية جدّاء عند سرعات عالية للغاية» كما أنه أصبح قادرًا على تحقيق أكثر مما كان قادرا 
على تحقيقه مع نظام الملكية الأعلى تكلفة والذي كان يستخدمه. ويقوم eBay‏ حاليًا 
بإدارة جزء كبير من احتياجات مركز البيانات - أكثر من ۲۵۰ تيرابايت من المخزون - في 
مجموعات كل من .DataStax Enterprises Apache Cassandra‏ 

وتشمل العناصر الفنية الإضافية التي Cus)‏ دورًا في قرار eBay‏ لنشر DataStax‏ 
Enterprise‏ على نطاق واسع» S‏ من قابلية التطوير الخطية للحلء والأمل الكبير في 
النجاح دون نقطة فشل واحدة, وأداء كتابة متميز. 

التعامل مع حالات الاستخدام المتنوعة: 

يقوم eBay‏ باستخدام DataStax Enterprise‏ للعديد من حالات الاستخدام 
ال مختلفة. وتوضح الأمثلة التالية بعض الطرق التي تستطيع الشركة من خلالها تلبية 
احتياجات بياناتها الضخمة من خلال قدرات معالجة البيانات والتحليلات السريعة التي 
يوفرها الحل. وبطبيعة الحالء فإن eBay‏ تجرب كميات ضخمة من سير الكتابة. والتي 
يتولى تنفيذها تطبيق Cassandra‏ عند معالجة DataStax Enterprise‏ بطريقة أكثر 
كفاءة من أي حل يقدمه RDBMS‏ أو .NoSQL‏ وتشاهد t eBay‏ أكثر من T‏ 
مليارات من الكتابات يوميًا عبر مجموعات Cassandra‏ المتعددة وأكثر من 0 مليارات 
من القراءات (معظمها غير متصل) Kass‏ 

وتنطوي حالة الاستخدام الواحدة التي يدعمها DataStax Enterprise‏ على قياس 
بيانات eBay‏ الاجتماعية التي يعرضها على صفحات eil‏ الخاصة به. ويقوم تقسيم 
Cassandra‏ في DataStax Enterprise‏ بتخزين جميع المعلومات اللازمة لتقديم 
بيانات ل ”يحب“ و“یفضل“ و“یرید“ على صفحات منتجات eBay‏ كما يوفر نفس 
البيانات الخاصة بصفحة ”تفضيلاتك“ على موقع eBay‏ والتي تحتوي على جميع 
العناصر التي يحبها المستخدم أو يمتلكها أو يرغب في شرائهاء مع عرض Cassandra‏ 
لصفحة ”تفضيلاتك“ كاملة. وتوفر eBay‏ هذه البيانات من خلال خاصية العدادات 
القابلة للتطوير المقدمة من Cassandra‏ 


Me‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


وتعد موازنة الأحمال وتوافر التطبيق من الجوانب المهمة لحالة الاستخدام الخاصة 
التي نحن بصددها. وقد أعطت حلول DataStax Enterprise‏ مخطط مشروع eBay‏ 
امرونة التي يحتاج إليها لتصميم نظام OSF‏ أي طلب مستخدم من الوصول إلى أي مركز 
بيانات. مع وجود مركز بيانات يحتوي على مجموعة واحدة من DataStax Enterprise‏ 
يشمل هذه المراكز. وتساعد هذه السمة في التصميم على موازنة تحميل ال مستخدم 
الوارد والقضاء على أي تهديد محتمل للتوقف عن العمل. وتستطيع eBay‏ إجراء تحليل 
عالي السرعة مع القدرة على الحفاظ على مركز بيانات منفصل يعمل على تشغيل عقد 
هادوب من نفس حلقة DataStax Enterprise‏ (انظر الشكل (V-V‏ وذلك فضلًا عن 
خط بيانات الأعمال التي تعمل على تزويد صفحات الويب التي يزورها العملاء. 


D — 




















Source: Data Stax. 


شكل :V-V‏ تطوير مركز متعدد البيانات التابع eBay :J‏ 


وتشمل حالة الاستخدام الأخرى شركة Hunch‏ (وهي شركة شقيقة لشركة (eBay‏ ”رسم 
“ShI‏ عناصر ومستخدمي eBay‏ والذي يقدم توصيات للعملاء بناءً على اهتمامات 
المستخدمين. ويمثل موقع eBay‏ على الويب ay‏ بيانيًا أساسيًا بين جميع المستخدمين 
والعناصر المعروضة للبيع. حيث يتم التقاط جميع الأحداث (المزايدة: والشراء والبيع» 
والسرد) من خلال أنظمة وتخزينها كرسم بياني في 8 ويرى التطبيق أكثر من 
٠٠‏ مليون من الكتابات يوميًا ويحمل أكثر من -£ مليار قطعة من البيانات. 

وتستخدم eBay‏ أيضًا DataStax Enterprise‏ للعدید من حالات استخدام السلاسل 
الزمنية والتي تعتبر معالجة كميات ضخمة من البيانات بشكل فوري أمرًا له أولوية قبل 
كل شيء. وهذا يتضمن تسجيل وتتبع الإشعار المتنقل (في كل مرة يرسل فيها eBay‏ 
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إشعارًا إلى جوال أو أي جهاز فإنه يتم تسجيله في (Cassandra‏ بالإضافة إلى الكشف 
عن حالات الغش» وتسجيل طلب / استجابة SOA‏ للتنزيلء وتحليلات وسجلات خادم 
RedLaser‏ (وهي شركة أخرى شقيقة لشركة eBay‏ 

ومن خلال الاطلاع على جميع حالات الاستخدام التي ذكرت» يكون الاشتراط الشائع هو 
مدة التشغيل. وتدرك eBay‏ تمامًا حاجتها إلى الحفاظ على أعمالها في مكانة متقدمة بالإضافة 
إلى الانفتاح من أجل أعمالهاء وتلعب DataStax Enterprise‏ دورًا أساسيًا في ذلك من خلال 
دعمها لمجموعات عالية التوافر. يقول Jay Patel‏ المهندس المخطط لمشروع :eBay‏ «علينا أن 
نكون على استعداد لتخطي الكوارث طوال الوقت. |« لشيء رائع É>‏ أن يسمح Cassandra‏ 
بمراكز بيانات متعددة نشطة حيث Lise‏ قراءة وكتابة بيانات في أي مكان وف أي وقت». 

أسئلة للمناقشة: 

ISU -Y‏ يحتاج eBay‏ إلى حل البيانات الضخمة؟ 

-Y‏ ما هي التحديات» وما هو الحل cer RAI‏ وما هي النتائج التي تم التوصل إليها؟ 
Source: DataStax. Customer case studies. datastax.com/resources/casestudies/eBay‏ 

(accessed July 2016). 


حالة عملية ۷-> 
فهم جودة ودقة معلومات دعم الرعاية الصحية على تويتر 

يستطيع جميع مستخدمي شبكة الإنترنت اليوم المساهمة با معلومات فضلًا عن 
الاستفادة من المعلومات Lé‏ وتُستخدم هذه القوة بطرق مختلفة. ويستطيع 
المستخدمون على منصات الشبكات الاجتماعية مثل Twitter‏ نشر معلومات عن أوضاعهم 
الصحية بالإضافة إلى تلقي المساعدة لأفضل طريقة لعلاج هذه الحالات الصحية. وقد 
استفسر العديد من المستخدمين عن جودة المعلومات المنشورة على منصات الشبكات 
الاجتماعية. وعلى الرغم من أن القدرة على نشر المعلومات الصحية على تويتر تبدو 
مفيدة للكثير من المستخدمين الذين يستخدمونها بقصد الحصول على الدعم لمرضهم. إلا 
أنه Glo‏ ما يكون هناك شك حول صحة هذه المعلومات. iols‏ عندما يقوم بنشرها أفراد 
عاديون. وقد سأل العديد من المستخدمين: «كيف أتأكد وأثق في المعلومات التي يقدمها 
غير الخبراء حول كيفية التصرف في مسألة حيوية مثل حالتي الصحية؟» 

ما هي أنواع المستخدمين الذين يشاركون ويناقشون أي نوع معلومات؟ وهل 
يقوم المستخدمون الذين لديهم عدد كبير من المتابعين بمناقشة ومشاركة نفس نوع 
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المعلومات التي يناقشها ويشاركها الممستخدمون الذين لديهم عدد أقل من المتابعين؟ 
يرجع عدد متابعي المستخدم إلى مدى تأثير المستخدم؛ إذ يتم قياس خصائص ال معلومات 
من حيث الجودة وال موضوعية من التغريدة المنشورة. وقد انبرى فريق من علماء 
البيانات لاستكشاف العلاقة بين عدد متابعي ال مستخدم وخصائص المعلومات التي قام 
المستخدم بنشرها )2015 -(Asamoah & Sharda,‏ 

الحل: 

تم التنقيب في البيانات من منصة jug‏ باستخدام API‏ التابع „Twitter J‏ وقد قام 
علماء البيانات بتكييف نموذج اكتشاف المعرفة وإدارة البيانات من أجل إدارة وتحليل 
هذه المجموعة الضخمة من البيانات. وقد تم تحسين النموذج لإدارة وتحليل البيانات 
الضخمة المستمدة من منصة الشبكة الاجتماعية وتضمن مراحل اكتساب معرفة المجال» 
وتطوير منصة البيانات الضخمة AEI‏ والحصول على البيانات وتخزيتهاء بالإضافة إلى 
تنظيف البيانات» والتحقق من صحتهاء وتحليلهاء كما تضمن النتائج والنشر. 

التقنية ا لمستخدمة: 





تم استخراج «lao sl‏ وإدارتهاء وتحليلها باستخدام Cloudera gjg‏ الخاص 
ب .Apache Hadoop‏ ويحتوي إطار Apache Hadoop‏ على العديد من المشاريع 
الفرعية التي تدعم أنواعًا مختلفة من أنشطة إدارة البيانات» مثل دعم المشروع الفرعي 
Apache Hive‏ للقراءة والكتابة. وإدارة بيانات التغريدات الضخمة. وقد استخدمت 
أدوات لتحليل البيانات مثل Gephi‏ والذي استخدم لتحليل الشبكات الاجتماعية و۸ 
للنمذجة التنبؤية. وقد قاموا بإجراء تحليلين متوازيين؛ تحليل الشبكة الاجتماعية لفهم 
الشبكة على المنصة واستخراج النص لفهم محتوى التغريدات التي نشرها ا مستخدمون. 

Tagg ماذا‎ 

وكما ذكرنا dalu‏ فقد تم تجميع وتحليل تغريدات من كل المستخدمين المؤثرين وغير 
المؤثرين. وقد أظهرت النتائج أن جودة وموضوعية ا معلومات التي ينشرها ا مستخدمون 
المؤثرون كانت أعلى من تلك التي ينشرها ا مستخدمون غير المؤثرين. كما وجدوا أيضًا أن 
المستخدمين المؤثرين كانوا مسيطرين على تدفق المعلومات في الشبكة وأن المستخدمين 
الآخرين كانوا أكثر جذبًا متابعة رأيهم حول موضوع ما. وقد كان هناك اختلاف واضح 
بين نوع دعم المعلومات التي يقدمها ا مستخدمون المؤثرون مقابل غيرهم» حيث ناقش 
ا لمستخدمون المؤثرون معلومات أكثر موضوعية فيما يتعلق بإدارة امرض كالتشخيصء 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري aer‏ 


الفصل السابع 


والأدوية» والعلاجات الرسمية: في حين قدم المستخدمون غير المؤثرين معلومات أكثر 
حول الدعم العاطفي والطرق البديلة للتعامل مع مثل هذه الأمراض. وبالتالي» فقد كان 
هناك اختلاف واضح بين ا مستخدمين المؤثرين وبين غيرهم من المستخدمين غير المؤثرين. 

يصور clle‏ البيانات من منظور غير الخبراء إمكانية زيادة توفير الرعاية الصحية من 
خلال مساعدة المرضى على تحديد واستخدام الموارد القيّمة على الويب من أجل إدارة حالتهم 
A,‏ وساعد هذا العمل Lol‏ على تحديد كيف هكن لغير الخبراء اكتشاف موقع معلومات 
ile JI‏ الصحية التي قد لا تكون بالضرورة مفيدة لإدارة أوضاع المرضى الصحية وترشيحها. 

-١‏ ما هو الشاغل الرئيس لعلماء البيانات فيما يتعلق بالمعلومات الصحية التي يتم 
نشرها على Twitter‏ 

-Y‏ كيف يضمن علماء البيانات أن تكون المعلومات المقدمة من غير الخبراء والتي 
تنشر على وسائل التواصل الاجتماعيء تحتوي بالفعل على معلومات صحية قيّمة؟ 

-Y‏ هل من المنطقي أن يشارك المستخدمون المؤثرون معلومات أكثر موضوعية بينما 
يكون تركيز المستخدمين غير المؤثرين على المعلومات الشخصية بشكل أكبر؟ وماذا؟ 
Sources: Asamoah, D., & Sharda, R. (2015). Adapting CRISP-DM process for social‏ 
network analytics: Application to healthcare. In AMCIS 2015 Proceedings. aisel.‏ 
aisnet.org/amcis 2015/bizAnalytics/GeneralPresentations/33/(accessed July 2016).‏ 


Sarasohn-Kahn, J. (2008). The wisdom of patients: Health care meets online social 
media. Oakland, CA: California HealthCare Foundation. 


أسئلة للمراجعة على القسم :£-V‏ 

-١‏ ما هى الخصائص المشتركة لتقنيات البيانات الضخمة الناشئة؟ 

-Y‏ ماهو MapReduce؟‏ وماذا يعمل؟ وكيف يقوم بعمله؟ 

-Y‏ ماهو هادوب؟ وكيف يعمل؟ 

-E‏ ما هي المكونات الرئيسة لهادوب؟ وما هي الوظائف التي يؤديها؟ 

0- ما هو SNOSQL‏ وكيف يتناسب مع صورة تحليلات البيانات الضخمة؟ 
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o-V‏ البيانات الضخمة ومستودعات البيانات: 

ليس هناك شك في أن ظهور البيانات الضخمة قد أدى إلى تغيير مستودعات البيانات وسوف 
يستمر في تغييرها بشكل uS‏ وقد كانت مستودعات بيانات المؤسسات (الفصلين ۲ Ys‏ حتى 
وقت قريب» هي محور جميع تقنيات دعم القرار. أما الآن فإن عليهم مشاركة أضواء الوافد 
الجديد والذي يتمثل في البيانات الضخمة. والسؤال الذي يطرح نفسه Glo‏ هو هل سيتم 
استبدال مستودعات البيانات وتقنياتها الأساسية RDBMS‏ بالبيانات الضخمة وتقنياتها التمكينية 
Jia‏ هادوب. وهل سنشهد Guas‏ بين مستودع البيانات والبيانات الضخمة sl)‏ من وجهة نظر 
التقنيةء بين هادوب $(RDBMSs‏ وفي هذا القسم سوف نوضح سبب عدم وجود أساس لهذه 
الأسئلةء وعلى الأقل سوف نبرر أن مثل هذا الاختيار ليس انعكاسًا للواقع في هذا الوقت. 

وقد شهد العقد الماضي أو نحو ذلك KAA‏ ملحوظًا في مجال أنظمة دعم القرار المعتمدة على 
الحاسب. والتي قد يُنسب إليها الفضل إلى حد كبير في مستودعات البيانات والتطورات التقنية في 
كل من البرامج والأجهزة للحصول على البيانات وتخزينها وتحليلها. وكلما زاد حجم البيانات» تزداد 
إمكانيات مستودعات البيانات. وقد اشتمل بعض التقدم الخاص بمستودعات البيانات على كل 
من المعالجة المتوازية على نطاق واسع (الانتقال من واحد أو عدد قليل إلى العديد من امعالجات 
المتوازية)» وشبكات منطقة التخزين (حلول التخزين القابلة للتطوير بسهولة) وتخزين الحالة 
«dall‏ ومعالجة قاعدة البيانات» والمعالجة في SIII‏ والقواعد العمودية (التوجه بالعمود). وهذا 
كله مجرد غيض من فيض. وقد ساعدت هذه التطورات في الحفاظ على الحجم المتزايد للبيانات 
لتظل تحت السيطرة بينما تقوم بخدمة احتياجات التحليلات الخاصة بصانعي القرار بفاعلية. 
وما ساعد على تغير المشهد في السنوات الأخيرة هو تنوع وتعقيد البيانات» مما جعل مستودعات 
البيانات غير قادرة على مسايرة التقدم. ومن الجدير بالذكر أن التنوع والسرعة هي التي أجبرت 
عام تقنية المعلومات على تطوير نموذج جديد وليس حجم البيانات» حيث يُطلق على هذا النموذج 
الآن «البيانات الضخمة». والآن بعد أن أصبح لدينا هذان النموذجان - نموذج مستودعات البيانات 
ونموذج البيانات الضخمة المتنافسان ظاهريًا على نفس الوظيفة - لتحويل البيانات إلى معلومات 
قابلة للتطبيق - فأي نموذج lagia‏ سوف يفرض نفسه؟ وهل هذا سؤال Jole‏ لطرحه؟ أم أننا نفتقد 
الصورة الكبيرة؟ ولذلك فإننا نحاول في هذا القسم إلقاء بعض الضوء على هذا السؤال امثير للاهتمام. 

وكما هو الحال بالنسبة للعديد من الابتكارات التقنية السابقةء فقد أثيرت ضجة حول نموذج 
البيانات الضخمة وتقنياته التمكينية مثل هادوب وع1160116م212. فغير الممارسين كغيرهم من 
الممارسين قد طغت عليهم الآراء المتنوعة. ووفقًا ا ذكره كل من Graham Awadallah‏ )2012« 
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فإن الزاعمين بأن هادوب يحل محل قواعد البيانات العلائقية ويصبح هو مستودع البيانات 
الجديد لا يملكون البرهان على مزاعمهم. ومن السهل معرفة مصدر هذه الادعاءات لأنه يمكن 
تشغيل كل من هادوب وأنظمة مستودع البيانات بالتوازيء كما هكن توسيع نطاقها إلى أحجام 
هائلة من البيانات» بدون مشاركة أي أسلوب بنائي. وأما على المستوى المفاهيميء فقد يعتقد اطرء 
أنها قابلة للتبادلء في حين أنها ليست EUIS‏ وأن الاختلافات بين الاثنين تفوق أوجه التشابه. ولكن 
إذا لم تكن قابلة للتبادلء فكيف نقرر متى نستخدم هادوب ومتى نستخدم مستودع البيانات؟ 
حالات استخدام :Hadoop‏ 
كما سبق أن وضحنا في هذا الفصلء لقد كان ظه ور هادوب نتيجة للتطورات الجديدة في 
تقنيات الحاسب وشبكة التخزين؛ حيث يوفر هادوب طبقة من البرامج التي تمتد عبر الشبكة 
بأكملهاء وتحويلها إلى نظام «tolg‏ وذلك باستخدام المكونات المادية للحاسب كأساس. lyg‏ على 
ذلك فإن هناك بعض الاختلافات الرئيسة التي تظهر بوضوح في هذا البناء منها: 
- يعتبر هادوب مستودعًا فضلا عن أنه يعمل على تنقية البيانات الأولية. 
- يعتبر هادوب أرشيقًا قوبًا واقتصاديًا ونشطًا. 
ومن ثم» OB‏ هادوب يستحوذ على طرفي دورة حياة البيانات واسعة النطاق بدايةٌ عندما تظهر 
البيانات AJY‏ وأخيرًا عندما تتراجع البيانات» ولكن لاتزال هناك حاجة إليها في بعض الأحيان. 
-١‏ هادوب كمستودع ومكان تنقية: نظرًا لأن أحجام البيانات الضخمة تصل من مصادر مثل 
أجهزة الاستشعارء والآلات» ووسائل التواصل الاجتماعي وتيارات النقرء فإن الخطوة الأولى 
تتمثل في التقاط جميع البيانات بطريقة دقيقة وتكلفة عملية. فعندما تكون أحجام البيانات 
ضخمة» فإن الإستراتيجية التقليدية للخادم المفرد لا تعمل لفترة طويلة. ومن OB e$‏ تدفق 
البيانات في HDFS‏ هنح مخططي المشروع المرونة التي هم في أمس الحاجة إليهاء حيث 
إنهم لا يمكنهم فقط التقاط ٠٠١‏ تيرابايت في اليوم الواحد, بل يمكنهم Vl‏ ضبط تهيئة 
هادوب للأعلى أو للأسفل لمواجهة تدفق أو انخفاض البيانات ها يتناسب مع مقدارهاء وهذا 
يتحقق بأقل تكلفة ممكنة لكل جيجابايت نظرًا لاقتصاديات المصادر المفتوحة والاستفادة من 
المكونات المادية للحاسب. ونظرًا لأن البيانات يتم تخزينها على وحدة التخزين المحلية بدلا 
من شبكات منطقة التخزين» فإن الوصول إلى البيانات في هادوب يكون أسرع بكثير في كثير 
من الأحيان» كما أنه لا يعيق الشبكة بحركة التيرابايتس من البيانات. وهجرد التقاط البيانات 
الخام» فإنه يتم استخدام هادوب لتنقيتها؛ حيث يمكن لهادوب أن يعمل بمثابة محرك موازي 
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«محرك ETL‏ على المنشطات». من خلال الاستفادة من تقنيات تحويل البيانات التجارية 
أو المكتوبة بخط اليد؛ إذ تتطلب العديد من هذه العمليات الخاصة بتحويل البيانات الأولية 
تفكيك البيانات ذات الصيغة الحرة المعقدة وتحويلها إلى تنسيقات liag dolio‏ ينطبق 
بشكل خاص على تيارات النقر (أو سجلات الويب) وتنسيقات بيانات الاستشعار المعقدة. 
وبناءً على ذلك فإن المبرمج يحتاج إلى فصل الصالح عن الطالح (تنقية البيانات من كل ما 
ليس له أهمية) وتحديد ما هو (i$‏ وسط هذا الصخب. 

-Y‏ هادوب كأرشيف نش ط: في مقابلة أجريت عام ۲۰۰۳ مع ACM‏ ادعى Jim Gray‏ أنه من 
الممكن معالجة الأقراص الصلبة كأشرطة. وعلى الرغم من أن أمر الاستغناء عن أرشفة الشريط 
المغناطيسي قد يستغرق عدة سنوات. إلا أنه يتم إعادة توجيه بعض أجزاء عبء العمل 
الشريطية بالفعل إلى مجموعات هادوب. ويرجع هذا التحول لسببين أساسيين. أولهماء أنه 
على الرغم من أن أمر مستودعات البيانات على الشريط قد يبدو غير مكلفء إلا أن تكلفته 
الحقيقية تظهر مع صعوبة الاسترجاع. ولا يقتصر الأمر فقط على الساعات - إن لم تكن الأيام - 
التي تتطلبها البيانات المخزنة في وضع عدم الاتصال من أجل استرجاعهاء بل إن لفائف الشريط 
نفسها عرضة للتدهور مع مرور الوقتء الأمر الذي يجعل من عملية فقدان البيانات حقيقة 
واقعة ويجبر الشركات على استيعاب هذه التكاليف. ومما يزيد الأمور سوءًا هو تغير تنسيقات 
الأشرطة كل عامينء مما يتطلب من المنظمات إما إجراء عمليات ترحيل هائلة للبيانات إلى 
تنسيق الشريط الأحدث أو المخاطرة بعدم القدرة على استعادة البيانات من الأشرطة القدهة. 
وأما الأمر الثاني» فقد تبين أن هناك قيمة لحفظ البيانات التاريخية على الإنترنت مع إمكانية 

الوصول إليها بسهولة. وكما هو الحال في مثال تيار النقرء فإن الاحتفاظ بالبيانات الأولية على 

قرص (بكرات) اللف لفترة أطول يسهل على الشركات إعادة النظر في البيانات عندما يتغير السياق 
والقيود الجديدة التي تحتاج إلى تطبيقها. إن عملية البحث عن آلاف الأقراص باستخدام هادوب 
تكون أسرع وأكثر سهولة من اللف عبر مثات الأشرطة المغناطيسية. وبالإضافة إلى ما سبق» فإنه 
مع استمرار تضاعف كثافات الأقراص كل VA‏ شهرّاء يصبح من المجدي اقتصاديًا بالنسبة للمنظمات 
أن تحتفظ بالبيانات الخام أو المنقحة الخاصة بالعديد من الأعوام في .HDFS‏ ومن تم OL‏ شبكة 
تخزين هادوب تكون مفيدة في كل من المعالجة الأولية للبيانات الخام ومستودعات البيانات على 
المدى الطويل. فهو يعد بحق «أرشيقًا نش طًا» نظرًا لأنه لا يقوم بمستودعات البيانات ويحميها 
فحسبه بل إنه أيضًا OR‏ المستخدمين من استخلاص القيمة بسرعة وسهولة وبشكل دائم. 
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حالات استخدام مستودعات البيانات: 
لقد أصبحت قائمة المميزات المتوفرة في مستودع البيانات مذهلة بدرجة كبيرةء بعد مرور ما 

يقرب من Gle ٠١‏ من الاستثمار والتنقية, والنمو. فقد Cus‏ على تقنية قواعد البيانات العلائقية 

باستخدام المخططات gosg‏ أدوات ذكاء الأعمال» وتتمثل الاختلافات الرئيسة في هذه البنية xà‏ 

sal -‏ مستودع البيانات. 

- دمج البيانات التي توفر قيمة الأعمال. 

- أدوات ذكاء الأعمال التفاعلية للمستخدمين النهائيين. 

MySQL مثل‎ dila مستودع البيانات: إن الفهرسة الأساسيةء الموجودة في قواعد البيانات‎ shol -١ 
تُستخدم بغرض تحسين زمن استجابة الاستعلام أو فرض قيود‎ dud لهي سمة‎ Postgres أو‎ 
النماذج الأكثر تقدمًا مثل: طرق العرض الفعلية» وفهارس الانضمام‎ 9S على البيانات؛ حيث‎ 
الإجمالي» والفهارس المكعبة. وفهارس الانضمام المتفرق» من تحقيق مكاسب متعددة للأداء في‎ 
تحسين الأداء الأكثر أهمية حتى الآن اخسن القائم على‎ O مستودعات البيانات. ومع ذلك‎ 
الواردة ويقوم بدراسة خطط متعددة من أجل تنفيذ‎ SQL التكلفة؛ حيث يقوم امسن بفحص‎ 
SQL كل طلب بحث في أسرع وقت ممكنء حيث يستطيع تحقيق ذلك من خلال مقارنة طلب‎ 
لتصميم قاعدة البيانات وإحصائيات بيانات شاملة والتي تساعد على تحديد أفضل مزيج من‎ 
لديه مبرمج عبقري يقوم بفحص كل استعلام‎ Libs خطوات التنفيذ. ويبدو اخسن في جوهره‎ 
وضبطه من أجل الحصول على أفضل أداء. وبسبب عدم وجود مُحَسن أو إحصائيات دهوغرافية‎ 
ساعات» حتى مع وجود‎ öde للبيانات» فإن الاستعلام الذي يمكن تشغيله في دقائق قد يستغرق‎ 
العديد من الفهارس. ولهذا السببء فإن موردي البيانات يقومون باستمرار بإضافة أنواع جديدة‎ 
من الفهارس» والتقسيم» والإحصائيات» بالإضافة إلى مميزات للمُحَسن. وعلى مدى الثلاثين عامًا‎ 
الماضية» كان كل إصدار للبرامج عبارة عن إصدار أداء. وكما س نلاحظ في نهاية القسم الخاص‎ 
الاستعلام.‎ elof بهادوب» أنه (أي هادوب) يتفوق على مستودعات البيانات التقليدية في مجال‎ 

-Y‏ دمج البيانات التي توفر قيمة الأعمال: وهي الالتزام بالإجابة على أسئلة الأعمال الأساسية في 
قلب أي مستودع. وتمثل البيانات المتكاملة, الأماس الوحيد المطلوب لتحقيق هذا الهدف. 
وأما سبب وجود مستودعات البيانات فيتمثل في سحب البيانات من مجالات تابعة متعددة 
بالإضافة إلى العديد من التطبيقات إلى مستودع واحد. ويتعين على مصممي نماذج البيانات 
ومهندسي استخراج» وتحويلء وتنزيل (ETL)‏ مع البيانات الوصفية (ميتاداتا)» وأدوات 
تنظيف البيانات» والعمل الدقيق أن يقوموا بترشيد تنسيقات البيانات» وأنظمة المصدر 
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والمعنى الدلالي للبيانات لجعلها مفهومة وموثوقة, وهذا يساعد على إنشاء مفردات مشتركة 
داخل الشركة بحيث يتم قياس وفهم المفاهيم الأماسية مثل: «العميل» و«نهاية الشهر» 
و«المرونة السعرية» بشكل موحد. الجدير بالذكر أن تجميع البيانات وتنظيفها ودمجها كما 
هي في مستودع البيانات لا يتم إلا في مركز تقنية المعلومات بأكمله» وليس في مكان آخر. 

«Tableau «MicroStrategy أدوات ذكاء الأعمال التفاعلية: تتيح أدوات ذكاء الأعمال من مثل:‎ -Y 
وغيرها من الأدوات للمستخدمين التجاريين إمكانية الوصول المباشر إلى أفكار‎ IBM Cognoss 
مستودع البيانات. فبدايةٌ يستطيع مستخدم الأعمال إنشاء تقارير بالإضافة إلى إمكانية إنشاء‎ 
تحليلات معقدة بسرعة وسهولة باستخدام هذه الأدوات. ونتيجة لذلكء فإن هناك اتجاهًا‎ 
في العديد من مواقع مستودع البيانات نحو الخدمة الذاتية للمستخدم النهائي. كما يستطيع‎ 
مستخدمو الأعمال بكل سهولة طلب تقارير أكثر مما توفره تقنية المعلومات. غير أن الأهم من‎ 
بالبيانات؛ إذ يمكنهم تشغيل تقريرء‎ daB الخدمة الذاتيةء هو أن يكون المستخدمون على دراية‎ 
واكتشاف ما فاتهم من مقياس أو فرز )5314( بالإضافة إلى إجراء تعديل وتشغيل التقرير‎ 
الخاص بهم مرة 45,21 كل ذلك في غضون دقائق. ولا شك أن هذه العملية تؤدي إلى حدوث‎ 
القرار. وأول هذه التغييرات»‎ guo تغييرات كبيرة في فهم المستخدمين للأنشطة التجارية وعملية‎ 
هو توقف المستخدمين عن طرح أسئلة تافهة ويبدأون بطرح أسئلة إستراتيجية أكثر تعقيدًا.‎ 
وبشكل عام فإنه كلما كان التقرير أكثر تعقيدًا وإستراتيجية» زادت الأرباح والإيرادات ووفورات‎ 
التكاليف التي يجنيها اطمستخدم» وهذا من شأنه أن يحول بعض ال مستخدمين إلى «مستخدمين‎ 
أقوياء» في الشركة؛ حيث يصبح هؤلاء الأفراد عباقرة في إثارة قيمة الأعمال من البيانات بالإضافة‎ 
إلى توفير معلومات إستراتيجية قيمة للموظفين التنفيذيين. الجدير بالذكر أن كل مستودع‎ 
من المستخدمين الأقوياء.‎ ٠١ إلى‎ Y بيانات في أي مكان يحتوي على: من‎ 


المجالات الرمادية (أي واحد من الاثنين سوف يقوم بأداء المهمة): 

على الرغم من وجود العديد من المجالات التي تميز واحدًا عن الآخرء فإن هناك أيضًا مجالات 
رمادية لا هكن فيها تمييز مستودع البيانات عن هادوب بوضوح. فقي هذه المجالات» يمكن 
للأداة إما أن تكون الحل المناسب وإما أن تقوم بأداء مماثل أو وظيفة غير جيدة على المهمة التي 
في متناول اليد. ويعتمد اختيار واحدٍ دون الآخر على متطلبات وتفضيلات المنظمة. وفي العديد 
من الحالات» يعمل كل من هادوب ومستودع البيانات معا في سلسلة إمداد ا معلومات» وكما هو 
الحال في كثير من الأحيانء تكون إحدى الأداتين هى الأفضل لتحمل عبء عمل معين Graham)‏ 
Awadallah, 2012‏ &( ويوضح الجدول (1-1) النظام الأمامي المفضل (واحد مقابل الآخرء أو 
احتمال المساواة) في إطار عدد من المتطلبات المرصودة الشائعة. 
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جدول :V-V‏ متى يجب استخدام أي منصة Hadoop‏ مقابل DW‏ 
متی يجب اع اي P‏ 2 



























































المتطلبات مستودع البيانات هادوب 

وقت استجابة منخفض وتقارير تفاعلية بالإضافة إلى In -OLAP‏ 

لالتزام يكون متطلبًا (V m] „ANSI ۲۰۰۴ SQL‏ 
معالجة أو استكشاف البيانات الخام غير المهيكلة. ۳ 
لمحفوظات على شبكة الإنترنت بدلا للشريط. (V‏ 
لتنظيف عالي الجودة والبيانات المتسقة. v‏ 
من ٠٠١‏ إلى ٠٠٠١‏ من المستخدمين المتزامنين. m‏ 
اكتشاف علاقات غير معروفة في البيانات. ia‏ 
منطق عملية معقدة متوازية. wl‏ 
تحليل CPU‏ المكثف. 

النظام والمستخدمون وحوكمة البيانات. Ina‏ 
العديد من لغات البرمجة المرنة التي تعمل بالتوازي. V‏ 
استكشافات sandbox‏ غير المقيدة, وغير الخاضعة للحكم. VI‏ 
تحليل البيانات المؤقتة. [v]‏ 

الأمان الشامل والامتثال التنظيمي. [v]‏ 7 


























الجمع بين هادوب ومستودع البيانات: 
هناك العديد من السيناريوهات المحتملة والتي بموجبها يكون الجمع بين كل من هادوب 
وتقنيات مستودعات البيانات القائمة على DBMS‏ العلائقية في الاستخدام, ASÍ‏ منطقية. وفيما 
يلي بعض هذه السيناريوهات )2012 :(White,‏ 
-١‏ استخدام هادوب لتخزين وأرشفة البيانات متعددة الهياكل: وحينئذ يمكن استخدام موصل 
ل DBMS‏ العلائقية من أجل التنقيب في البيانات المطلوبة من هادوب لتحليلها بواسطة 
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مفاهيم وأدوات البيانات الضخمة 


5 العلائقية. فإذا كانت DBMS‏ العلائقية تدعم وظائف MapReduce‏ فإن هذه 
الوظائف يمكن اس تخدامها للقيام بعملية الاستخراج. وعلى سبيل «JUL‏ فإن محول Aster-‏ 
Et Hadoop‏ وظائف SQOL-MapReduce‏ لتوفير تنزيل سريع للبيانات ثنائية الاتجاه 
بين كل من Aster Databases HDFS‏ وعندئذ يمكن تحليل البيانات التي تم تنزيلها في 
قاعدة بيانات Aster‏ باستخدام كل من -MapReduces SQL‏ 

-Y‏ استخدام هادوب AA‏ وتحويل؛ و / أو دمج البيانات متعددة الهياكل: ويمكن استخدام doga‏ مثل 
محول Aster-Hadoop‏ لاستخراج النتائج من معالج هادوب ل DBMS‏ العلائقية من أجل تحليلها. 

-Y‏ استخدام هادوب لتحليل كميات ضخمة من البيانات متعددة الهياكل ونشر النتائج التحليلية: 
حيث يعمل هادوب في هذا التطبيق, بمثابة منصة للتحليلات غير أنه يمكن إرجاع النتائج مرة 
أخرى إلى بيئة مستودعات البيانات التقليدية» أو مخزن بيانات مشترك بمجموعة العمل أو 
واجهة مستخدم مشتركة. 

-E‏ استخدام نظام DBMS‏ العلائقي الذي يوفر إمكانيات MapReduce‏ كمنصة حوسبة 
استقصائية: حيث يستطيع علماء البيانات استخدام نظام DBMS‏ العلائقي (مثل: نظام 
قاعدة بيانات (Aster‏ لتحليل مجموعة من البيانات المهيكلة ومتعددة الهياكل (المحملة من 
هادوب) باستخدام مزيج يتكون من كل من معالج SQL‏ ووظائف MapReduce‏ التحليلية. 

0- استخدام أداة استعلام Front-end‏ للوصول إلى البيانات وتحليلها: وهناء يتم تخزين البيانات 
في كل من هادوب DBMSs‏ العلائقية. 
فهذه السيناريوهات تدعم البيئة التي يكون فيها كل من هادوب و188155 العلائقية 

منفصلّين عن بعضهما البعض كما يتم استخدام برنامج الاتصال لتبادل البيانات بين النظامين 

(انظر الشكل ۸-۷). ومن المرجح أن تتجه الصناعة على مدى السنوات القليلة المقبلة نحو 
تقنيات هادوب المرتبطة بإحكام بالإضافة إلى تقنيات مستودع البيانات المستندة إلى eli‏ إدارة 
قواعد البيانات العلائقية على مستوى البرامج والأجهزة على حد سواء. حيث يوفر هذا التكامل 

العديد من الفوائد. والتي تشمل عدم الحاجة إلى تثبيت بالإضافة إلى صيانة أنظمة متعددة, 

وتقليل حركة البيانات» وتوفير مخزن بيانات وصفية ميتاداتا واحد من أجل تطوير التطبيقات» 

فضلًا عن توفير واجهة واحدة لكل من مستخدمي الأعمال والأدوات التحليلية. وقد قدمت 

المقالة الافتتاحية (القسم ۱-۷) مثالا على كيفية دمج البيانات التي هي من مستودع البيانات 
التقليدي ومجموعتّي البيانات المختلفتين وغير المهيكلتين والمخزنتين في هادوب من أجل إنشاء 

تطبيق تحليلي للحصول على إحصاءات حول تفاعلات العميل مع الشركة قبل إلغاء الحساب. 
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وبصفتك dias‏ فإن اهتمامك ينصب على الأفكار التي يمكنك استخلاصها من البيانات» وليس على 
ما إذا كانت البيانات مخزنة في مستودع بيانات مهيكل أو مجموعات هادوب. 
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Sources: Teradatacorp. 


شكل :A-V‏ التعايش بين Hadoop‏ ومستودعات البيانات 


أسئلة للمراجعة على القسم :0-V‏ 

-١‏ ما هي التحديات التي تواجه مستودعات البيانات والبيانات الضخمة؟ وهل نشهد نهاية عصر 
مستودعات البيانات؟ lbg‏ نعم أو اذا SY‏ 

-Y‏ ما هي حالات الاستخدام للبيانات الضخمة وهادوب؟ 

-Y‏ ما هي حالات الاستخدام ممستودع البيانات و1108215؟ 

$RDBMS; في أي السيناريوهات هكن الجمع بين هادوب‎ -٤ 


I-V‏ موردو ومنصات البيانات الضخمة: 
يتطور المشهد الخاص موردي البيانات الضخمة باعتباره exe‏ تقنيًا جديدًا نسبيًا. وقد قام عدد 
من الموردين بتطوير تقسيمات هادوب الخاصة بهم» والتي يعتمد معظمها على توزيع Apache‏ 
المجاني ولكن بمستويات مختلفة من التخصيص. وهناك اثنان من قادة السوق في مجال التوزيع وهما: 
(cloudera.com) Cloudera‏ و Cas (hortonworks.com) Hortonworks‏ بدأت Cloudera‏ 
بواسطة خبراء البيانات الضخمة Le‏ فيهم jin Doug Cutting‏ هادوب Jeff Hammerbachers‏ 
عام البيانات السابق في موقع التواصل الاجتماعي „Facebook‏ أما هورتنورك فقد اشتقت من "Yahoo‏ 
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حيث تقدم كلتا الشركتين عرض التدريب / الخدمات المدفوعة الأجر على مستوى المؤسسة كما تقدم 
برمجيات إدارة هادوب مسجلة الملكية, بالإضافة إلى التوزيع الذي تقدمه في الأساس. كما تقوم 
(mapr.com) MapR‏ - وهي منشأة أخرى في هذ! المجال - بتقديم تقسيم هادوب الخاص بها والذي 
يكمل HDFS‏ بنظام ملفات الشبكة الخاص بها (NFS)‏ من أجل تحسين الأداء. وقد تشاركت شركة 
EMC Greenplum‏ مع شركة MapR‏ في إصدار تقسيم هادوب الخاص بهما في مايو Y‏ وهذه 
الأمثلة لا تمثل إلا Bas‏ قليلًا من الشركات (القديمة والحديثة) التي تزاحم في المشهد التنافسي الخاص 
بأدوات ومقدمي الخدمات لتقنيات هادوب. 

وفي عاط NoSQL‏ فإن هناك Bae‏ من الشركات المبتدئة تعمل على تسليم إصدارات معتمدة 
تجاريًا من الصفات المميزة المختلفة الخاصة ب -NoSQL‏ فعلى سبيل JELI‏ تقدم DataStax‏ 
نسخة تجارية من Cassandra‏ تتضمن دعم المؤسسات والخدمات» فضلا عن التكامل مع هادوب 
والبحث عن المؤسسات المجانية عبر .Lucene Solr‏ ويقوم معظم موردو تكامل البيانات الخاصة 
ا في ذلك Pervasive Softwares Informatica‏ بالإضافة إلى Jas) Syncsort‏ جولات في 
سوق البيانات الضخمة مع روابط هادوب والأدوات المكملة التي تستهدف تسهيل نقل البيانات 
على المطورين حول وداخل مجموعات هادوب. 

كما تشهد طبقة التحليلات في مجموعة البيانات الضخمة Lépj‏ تطورات مهمة. فعلى سبيل 
المثال» توجد شركة ناشئة تُسمى Datameer‏ وتقوم هذه الشركة بتطوير ما تقول عنه بأنه 
منصة ذكاء الأعمال «الكل في واحد» من أجل هادوب» بينما قام برنامج Tableau‏ المتخصص في 
تصوير البيانات بإضافة هادوب واتصال مستودع بيانات الجيل التالي بمجموعة منتجاته. وفي 
الوقت نفسه. فإن شركة EMC Greenplum‏ لديها كُورّس Chorus‏ وهو عبارة عن ملعب 
لعلماء البيانات حيث يمكنهم جمع» do ads‏ وتبادل كميات كبيرة من البيانات من أجل التحليل. 
وهناك موردون آخرون يركزون على حالات استخدام تحليلية محددة: مثل ClickFox‏ إلى جانب 
مُحرك تحليلات تجربة عملائها. ويعمل عدد من موردي ذكاء الأعمال التقليديينء وأبرزهم 
MicroStrategy‏ على الدمج بين تحليل البيانات الضخمة وكفاءة التقارير في منتجاتهم. 

كما أن مساحات تطبيق البيانات الضخمة تنمو Lél‏ حيث تقدم العديد من الشركات 
تطبيقات مبنية للاستفادة من مجموعات هادوب وإطار .MapReduce‏ وتحتوي الأدوات 
المجانية مفتوحة ا مصدر مثل لغة برمجة R‏ على العديد من الدوال المُنفذة للاستفادة من التنفيذ 
ا متوازي من خلال مجموعات. وعلى سبيل المثالء تقدم شركة Treasata‏ تطبيقات البيانات 
الضخمة كخدمة للعديد من الصناعات. 
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وفي الوقت نفسه. فقد شهد سوق مستودع بيانات الجيل التالي مؤخرًا تجربة دمج كبيرة. فهناك 
jl‏ بعة من الموردين القادة في هذا المجال وهم Aster Datas .Verticas .Greenplums Netezza‏ 
والذين تم اندماجهم مع HP EMCs IBM‏ وتيراداتاء على التوالي. وقد تم اندماج EMC‏ 
مع Dell‏ كما يلعب الموردون العمالقة Oracle‏ و1831 أيضًا في مساحة البيانات الضخمة. فقد 
تنيت Oracle‏ نهج أدوات البيانات الضخمة باستخدام Exalogicg Exadata‏ وأجهزة البيانات 
الضخمةء حيث يقوم جهاز البيانات الضخمة بدمج توزيع Clouderas Hadoop‏ مع قاعدة بيانات 
Oracles NoSQL‏ وأدوات تكامل البيانات. ويعتمد برنامج BigInsights‏ 181/5 على Apache‏ 
Hadoop‏ غير أنه يشتمل على العديد من الوحدات الخاصة والتي تتضمن قاعدة البيانات Netezza‏ 
InfoSphere Warehouse;‏ وأدوات ذكاء الأعمال Cognos‏ وإمكانيات SPSS‏ للتنقيب في البيانات. 
كما يُقدم أيضًا تيارات IBM InfoSphere‏ وبرنامج مصمم لتحليل تيارات البيانات الضخمة. ومع 
نجاح العلامة التجارية Watson analytics‏ فإن شركة IBM‏ تقوم بطرح العديد من عروض التحليلات 
الخاصة بها بشكل عام وعروض البيانات الضخمة بشكل خاص تحت تصنيف 1188]505. وقد نتج 
عن استحواذ تبراداتا على Aster‏ تقديم منتج مثير للإعجاب في Teradata Aster‏ التي تنفذ as‏ من 
وظائف التحليلات الشائعة الاستخدام في بيئة البيانات الضخمة. وفيما يلي سنقدم hega‏ عن بيئات 
كل من Teradata Aster 183/5 InfoSphere‏ بالإضافة إلى تقديم حالة عملية قصيرة لكل منهما. 
وقد gel‏ تقديم هذين البرنامجين هنا تحديدًا نظرًا لأن كلا lagia‏ يعد من البرامج الناجحة تجاريًاء 
كما تتوفر لهم مواد تعليمية كثيرة والتي تتضمن البرامج القابلة للتنزيل. 
منصة :IBM's InfoSphere BigInsights‏ 

مقدمة: يعد InfoSphere BigInsights‏ التابع لشركة IBM‏ منصة 4668 على مشروع Apache‏ 
Hadoop‏ المجاني لتحليل البيانات اطهيكلة التقليدية الموجودة في قواع د البيانات القدهة إلى 
جانب البيانات شبه المهيكلة وغير المهيكلة مثل النصوص, والفيديوء والصوت, والصورء ووسائل 
التواصل الاجتماعي» وسجلات الويبء وتيارات النقر. حيث تقوم المنصة بدمج العديد من 
تطبيقات MapReduce‏ من خوارزميات التحليلات لتشغيل تطبيقات متوازية على نطاق glo‏ 
وهو مصمم لتوفير تحليلات متقدمة عن تقنية هادوب التي تم تحسينها بشكل خاص من أجل 
متطلبات تحليل البيانات الضخمة. 

أسلوب البناء: يعرض الشكل (3-V)‏ المكونات المختلفة الخاصة ب IBM InfoSphere‏ 
.BigInsights‏ ويوفر IBM — BigInsights‏ برنامج Apache Hadoop‏ القياسيء وبالإضافة 
إلى ذلك فإنه يوفر LÉT‏ تقنيات فريدة ولغات برمجة إلى جانب التحليلات المدمجة ومُسرعات 
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التطبيقات (مثل: النص» والجغرافيا ا مكانيةء والسلسلة الزمنيةء والتنقيب في البيانات» والتمويل» 
ووسائل التواصل الاجتماعيء وحدث الاتصالات» وبيانات الآلة) لتنفيذ العمليات ا متخصصة 
بكفاءة من أجل تلبية متطلبات تحليل البيانات الضخمة. فعلى سبيل «JUL‏ تم تصميم JAQL)‏ 
(JSON Query Language‏ من أجل تحسين معالجة وتحليل بيانات ترميز (SON)‏ وعناصر 
JavaScript‏ شبه المهيكلة. وهذه الوظائف مفيدة بشكل خاص في تحليل تيارات بيانات تويتر. 
BigSheets ëg‏ أداة نط جدول البيانات التي تدعم استكشاف وتصوير البيانات القابلة للتوسع 
على جدول SQL‏ الضخم المستقر على .HDFS‏ وتقدم لغة الاستعلام الملحقة AQL) Annotation‏ 
(Query Language‏ مكتبات مدمجة من أجل تحليلات النصوص المتقدمة عبر كميات هائلة 
من المستندات شبه وغير المهيكلة. أما BigR‏ فهو عبارة عن برنامج للتحليلات واسعة النطاق 
على هادوب والذي GÉ‏ من الوصول إلى البيانات المستقرة على 110۴8 ومعالجتهاء وتحليلهاء 
وتصورهاء حسب واجهة المستخدم haio R‏ وليس آخرّاء فإن أدوات InfoSphere BigInsights‏ 
od Eclipse. J‏ المطورين من تطوير برامج لتعمل على dnfoSphere BigInsights‏ حيث 
تتضمن هذه البرامج معالجات» ومولدات الكود. وبيئة اختبار لتبسيط جهود تطوير التطبيقات. 
ومع توفر كل هذه الأدوات في برنامج واحد مستمرء هكن تطوير ونشر التطبيق بسرعة في كتالوج 
BigInsights‏ القائم على الويب» ومن ثّم استخدام وحدة تحكم خاصة بالويب لنشر التطبيق على 
مجموعات هادوب والسماح للمستخدمين الذين لديهم الصلاحية أن يصلوا إليه. 
إصدار مؤسسة Biginsighits‏ 
الأدرات الإدارية pwy Aii‏ التحليلات والإكتشافات 
rry aia)‏ 
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IBM Infosphere à :۹-¥ شكل‎ 
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كيف تبدأ: يمكن تنزيل تجارب BigInsights‏ من الرابط: 
http://www.ibm.com/analytics/us/en/technology/hadoop/hadoop-trials.html‏ 
كما أن إصدار البدء السريع من BigInsights‏ متاح للتنزيل مجانًا عبر 
http://www.ibm.com/developerworks/downloads/im/Biginsightsquick/‏ 
وهو gles‏ مجموعة أحادية أو متعددة من المصدر .Hadoop es zàll‏ كما يتطلب نظامًا 
يحتوي على ذاكرة وصول عشوائي تبلغ سعتها GB‏ 16 على الأقل, بالإضافة إلى معالج رباعي النواة, 
GBs‏ 50 مساحة حرة. 
وأفضل مكان لبدء تعلم ما يخص InfoSphere BigInsights‏ هو من خلال مركز IBM‏ للمعلومات: 
http://www.ibm.com/support/knowledgecenter/SSPT3X 2.1.2/com.‏ 
ibm.swg.im.InfoSphere.Biginsights.tut.doc/doc/tut Introduction.html.‏ 
وتقدم الحالة العملية (0-V)‏ مثالًا يوضح كيف هكننا دمج البيانات من jolas‏ متعددة 
لتحليل تقارير الانفلونزا. 
حالة عملية ٥-۷‏ 
استخدام وسائل التواصل الاجتماعي للتنبؤ الفوري بنشاط الانفلونزا 
تفرض الأمراض المعدية fe És‏ على نظام الصحة العامة في الولايات المتحدة 
الأمريكية. وقد أدى ظهور فيروس نقص الناعة البشرية / الإيدز HIV/AIDS‏ في 
أواخر السبعينيات. وفيروس الانفلونزا HINI‏ في عام 7٠05‏ ووباء H3N2‏ خلال 
موسم شتاء ۲۰۱۲ - 2701 وتفشّي فيروس إيبولا Ebola‏ في عام Y- Yo‏ بالإضافة إلى 
فيروس Zika Q)‏ الذي انتشر في عام 015" إلى إثبات قابلية الناس للإصابة Jie‏ 
هذه الأمراض المُعدية. ومن الناحية الفعليةء فإنه يحدث تفي للانفلونزا كل عام 
بأشكال مختلفة وينتج عنها آثار متباينة. glug‏ متوسط التأثير السنوي لتفشَّي فيروس 
الانفلونزا ua asl‏ في الولايات المتحدة 7٠١57٠‏ شخصًا قَقّد الحياة من أعمار مختلفة 
غير محصورة. Y, Vo‏ مليون يوم في ا مستشفىء VV Es‏ مليون زيارة للعيادات الخارجية. 
وإجمالي ۸۷,١‏ مليار دولار كعبءٍ اقتصادي. ونتيجة لهذا الاتجاه المتزايد. فقد ظهرت 
على الساحة في السنوات الأخيرة أساليب جديدة لتحليل البيانات بالإضافة إلى ظهور 
تقنيات قادرة على اكتشاف مثل هذه الأمراض وتتبعها ورسم خرائطها وإدارتها. وقد 
أعطت أنظمة المراقبة الرقمية بوجه خاصء وعودًا بقدرتها على اكتشاف أنماط البحث 
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عن الصحة العامة وتحويل هذه الاكتشافات إلى إستراتيجيات قابلة للتطبيق. 

وقد بين هذا المشروع أنه يمكن استخدام وسائل التواصل الاجتماعي كطريقة فعالة 
للكشف المبكر عن تفشي الانفلونزا. فقد استخدمنا منصة البيانات الضخمة لاستخدام 
بيانات Twitter‏ من أجل مراقبة نشاط الانفلونزا في الولايات المتحدة. وقد تضمنت 
أساليبنا في تحليل OLLI‏ الضخمة استخراج كل من الزمانء واللمكانء والنص. فقد 
قمنا في التحليل الزمني بفحص ما إذا كان هكن بالفعل تكييف بيانات Twitter‏ للتنبؤ 
الفوري بمدى (gi‏ الانفلونزا. كما قمنا في التحليل GL‏ بتخطيط تفشي الانفلونزا 
للخاصية الجغرافية المكانية من بيانات تويتر لتحديد النقاط التي تؤثر فيها الانفلونزا 
بشكل فعال. وقد تم إجراء تحليلات النص للتعرف على الأعراض والعلاجات الشائعة 
للانفلونزا والتي تم ذكرها في التغريدات. 

وقد تم استخدام منصة IBM InfoSphere BigInsights‏ لتحليل مجموعتين من 
بيانات نشاط الانفلونزا؛ حيث استخدمت بيانات تويتر لمراقبة تفشّي الانفلونزا في الولايات 
المتحدة: بالإضافة إلى استخذام مستودع بيانات Cerner HealthFacts‏ لتتبع اللقاءات 
السريرية في العام الحقيقي. وقد انتقل حجم ضخم من التغريدات المتعلقة بالانفلونزا 
من تويتر باستخدام Twitter Streaming API‏ حتى تم استيعابه في مجموعات 
هادوب. 29 ,3 تلقي البيانات بنجاح» استخدمت أداة JSON Query Language‏ 
(JAQL)‏ لمعالجة وتحليل Oblo‏ ترميز JavaScript polis‏ الشبه منظمة JSON)‏ 
وبعد ذلك تم استخدام Hive‏ لهيكلة البيانات النصية وفصل المعلومات من أجل تحليل 
الموقع المكاني والزماني والتصوير في ۸. كما تم تنفيذ عملية التنقيب في البيانات بالكامل 
باستخدام وظائف MapReduce‏ وقد استخدمنا الحزمة BigR‏ لتقديم نصوص R‏ عبر 
البيانات ال مخزنة في .HDFS‏ حيث مكنتنا الحزمة BigR‏ من الاستفادة من الحساب 
المتوازي لنظام 111055 كما مكنتنا من إجراء عمليات .MapReduce‏ وقد استخدمت 
مكتبات API‏ لخرائط جوجل كأداة رسم خرائط أساسية لتصوير مواقع التغريد. 

وقد أظهرت النتائج التي توصلنا إليها أن التكامل بين كل من وسائل التواصل 
الاجتماعي والسجلات الطبية يستطيع أن يكون مكملًا ذا قيمة لنظم المراقبة القائمة. كما 
أكدت نتائجنا أن الحركة المرتبطة بالانفلونزا على وسائل التواصل الاجتماعي ترتبط ارتباطًا 
وثيقًا ghin‏ الانفلونزا الفعلية. وقد أظهر ذلك Ul‏ باحثون آخرون St Louis, Zorlu,)‏ 
Broniatowski, Paul, & Dredze, 2013‏ ;2012(. وقد أجر ينا تحليل سلسلة زمنية 
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للحصول على الارتباط المتبادل المكاني والزماني بين الاتجاهين )243( ولاحظنا أن مواجهات 
الانفلونزا الإكلينيكية تأي خلف المشاركات عبر الإنترنت. وبالإضافة إلى ذلك. فقد كشف 
dlos‏ موقعنا عن عدة مواقع ale‏ نشأت من خلالها أغلب التغريدات. وهذه النتائج 
يمكنها مساعدة ا مسؤولين عن الصحة والحكومات على تطوير Si el‏ أكثر دقة في 
الوقت المناسب أثناء حدوث «sil‏ وإبلاغ الأفراد حول المواقع التي يجب تجنبها خلال 
تلك الفترة الزمنية. 

ISU -Y‏ تستطيع وسائل التواصل الاجتماعي أن تكون بمثابة مؤشر مبكر على تفشّي 
الانفلونزا؟ 

-Y‏ ما هي المتغيرات الأخرى التي قد تساعد في التنبؤ Jig‏ هذه التفشيات؟ 

ISU -Y‏ تعد هذه المشكلة مثالا جيدًا هكن حله باستخدام تقنيات البيانات الضخمة 
المذكورة في هذا الفصل؟ 
Sources: Zadeh, A. H., Zolbanin, H. M., Sharda, R., & Delen, D. (2015). Social‏ 
media for nowcasting the flu activity: Spatial- temporal and text analysis. Business‏ 
Analytics Congress, Pre-ICIS Conference, Fort Worth, TX. Broniatowski, D. A.,‏ 
Paul, M. J., & Dredze, M. (2013). National and local influenza surveillance through‏ 
Twitter: An analysis of the 20122013- influenza epidemic. PloS One, 8(12), e83672.‏ 


Moran, P. A. (1950). Notes on continuous stochastic phenomena. Biometrika, 1723-. 


منصة :Teradata Aster‏ 
مقدمة: إن Teradata Aster‏ هي iai‏ بيانات ضخمة للتخزين الموزع ومعالجة مجموعات 
البيانات الكبيرة متعددة الهياكل. وقد استخدمت هذه المنصة لتحسين التسويق» وكشف الاحتيالء 
كما استُخدمت في التحليلات الرياضية» وتحليل الشبكات الاجتماعيةء بالإضافة إلى تحليلات البيانات 
«à VI‏ وتحليلات الطاقةء وتحليلات dile JI‏ الصحيةء والعديد من التطبيقات الأخرى. وقد قامت 
Teradata Aster‏ موازاة العديد من وظائف التحليلات التقليدية وال متقدمةء كما أن لديها قدرات 
لإجراء تحليل السلاسل dota‏ والتحليل الإحصائيء وتحليل الكتلة, والتنقيب في al‏ بالإضافة 
إلى التنقيب في قاعدة الترابطء وتحليل الشبكات الاجتماعيةء والتحليلات ال مرئيةء وتحليلات «gol!‏ 
والتحليلات التنبؤية؛ حيث تقوم بإجراء كل ذلك بطريقة موزعة. وبالإضافة إلى حزم التحليلات 
التقليديةء فإن Teradata Aster‏ لديها LÍ‏ العديد من حزم التحليلات الجديدة والفريدة لتحليل 

المسارء كما أنها متوافقة أيضًا مع coli)‏ البرمجة الأخرى مثل Javag Python R‏ 
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أسلوب البناء: لقد تم تكييف Teradata Aster‏ مع أسلوب بناء master-slave‏ الخاص ب 
-Apache Hadoop‏ وهو يتكون من Bale‏ ملكة وعقد عامل متعددة وهی تعادل VS‏ من عقد 
الاسم وعقد البيانات في هادوب» على التوالي. ويقدم الشكل (۱۰-۷) أسلوب TD Aster eli‏ 














Sources: Teradata Corp. 


Teradata Aster شكل 1۰-۷: بنية‎ 

وتقوم عقدة الملكة في الطبقة العليا بإدارة النظام» والمخططء ومعالجة الأخطاء وتوزيع الحساب 
على العاملين. فهي تقوم بتنسيق الاستعلامات وإرجاع نتائج الاستعلام. أما الطبقة الوسطى من 
البناء فهي تحتوي على العمالء حيث يقوم العمال بمستودعات البيانات باستخدام عامل التكرار 
الذي يعينه المسؤول. ومن 5 فإنهم يتحملون الأخطاء. ويتفاعل العمال مع بعضهم البعض لمعالجة 
الاستعلامات التي تطلبها الملكة. ويتكون المستوى الثالث من البناء من عقدة مسؤول التنزيل والتي 

تستقبل البيانات من أطراف ثالثة مثل نظم المعلومات. 
وتشتمل بنية TD Aster‏ على متجر ملف Aster File Store Jod‏ والذي aS‏ استيعاب بيانات 
متعددة مثل سجلات الويب» وبيانات جهاز الاستشعارء وبيانات سجل الآلة. وهو متوافق مع 
5 وأنظمة الملفات التقليدية الأخرى. وبمكن LA‏ توصيل المجموعة بقواعد بيانات أخرى 
مثل Teradata Warehouses «Oracle DB‏ بالإضافة إلى Hive‏ من خلال الروابط الأخرى اللتاحة. 
وبالنسبة لتحليل البيانات, فإن المستخدم هكنه كتابة الام تعلامات التقليدية لكل من SQL‏ و 
.SQL-MapReduce (SQL-MR)‏ و(501-61) .SQL-Graph‏ ويُعد Lb] SQL-MR‏ ل TD‏ 
Aster‏ والذي oS‏ أداء MapReduce‏ من وظائف التحليلات في قاعدة بيانات „Aster‏ وبالمثل» فإن 
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xis; SQL-GR‏ إطار عمل من أجل تمكين معالجة محرك الرسم البياني في قاعدة بيانات Aster‏ ويتم 
تنفيذ عملية الاستعلامات المكتوبة في SQL‏ أو SQL-SQL-MR‏ أو là SQL-GR‏ بشكل متوازي 
عبر ا مجموعة. وللوصول إلى قواعد البيانات وكتابة الاستعلامات» فإنه يمكن للمستخدمين إما استخدام 
أداة gİ(ACT) Aster Command‏ استخدام تطبيق من جانب العميل يسمى -Teradata Studio‏ 
وتشتمل الحزمة الكاملة من TD Aster‏ على أداة تستند إلى متصفح الويب للتصوير doll‏ 
تسمى .AppCenter‏ حيث .5$ استخدام AppCenter‏ لإنشاء أنواع مختلفة من التصويرات 
المرئية Jio‏ مخطط Sankey‏ ومخطط «sigma‏ ومخطط «chord‏ وهيكل الشجرةء ومخطط 
المجموعة الهرميةء وسحابة الكلمةء والمخطط الشريطيء والمخطط الدائريء وغيرها من الرسوم 
البيانية الإحصائية التقليدية الأخرى. 
كيف das‏ يتوفر الإصدار السريع من Teradata Aster‏ للتنزيل loe‏ حيث يمكن تنزيل TD Aster‏ 
Express‏ من هذا الرابط (https://aster-community.teradata.com)‏ وهو يتكون من جهازين 
افتراضيين: ملكة واحدة وعامل واحد. كما أنه يتطلب lae‏ لا يقل عن € GB‏ من الرامات «ذاكرة 
الوصول العشوائية». ويمكن للمستخدم تنزيل GB W‏ من البيانات في Aster Express‏ كما يمكن 
الوصول إلى دليل البدء من خلال بوابة شبكة جامعة تيراداتا www.teradatauniversitynetwork.)‏ 
(com‏ وللوص ول إلى الوثائق والتعليمات والتمارين ومجموعات البيانات من أجل تعلم Teradata‏ 
Aster‏ فإنه يجب على الطرء إنشاء حساب على موقع TUN‏ على الويب. 
وقد سبق أن رأينا أمثلة على استخدام Teradata Aster‏ في المقالة الافتتاحية في الفصل الأول 
à‏ تحليلات dol JI‏ وأيضًا à‏ بداية هذا الفصل. وتوفر الحالة العملية(۷-١)‏ مثالًا آخر على 
استخدام -Teradata Aster‏ 
حالة عملية ٠-۷‏ 
تحليل أنماط المرض من مستودع بيانات السجلات الطبية الإلكترونية 
لقد تم منح مركز الإبداع في الأنظمة الصحية في جامعة أوكلاهوما الحكومية, 
مستودعًا ضخمًا للبيانات من قبل شركة Cerner Corporation‏ والتي هي عبارة عن 
مزود السجلات الطبية الإلكترونية الرئيسة (EMRS)‏ للمساعدة في تطوير التطبيقات 
التحليلية. حيث يشتمل مستودع البيانات على EMRs‏ في زيارات أكثر من 0٠0‏ مليون 
من المرضى الفريدين من نوعهم عبر مستشفيات الولايات المتحدة (1990 - (YNE‏ كما 
أنه يشمل أكثر من ۸٤‏ مليون زيارة قاهرة وطارئة وإسعافية. فهي أكبر قاعدة بيانات 
علائقية وحيدة في هذه الصناعة والتي تشتمل على سجلات شاملة مع الصيدليات» 
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والمختبرات» والأحداث cb p E‏ والقبول وبيانات الفوترة. كما تشتمل قاعدة البيانات 
على أكثر من ۲,٤‏ مليار نتيجة معملية وأكثر من ١90‏ مليون طلب با يقرب من 56٠١‏ 
علاج بالاسم والعلامة التجارية. حيث تعد هذه القاعدة واحدة من أكبر مجموعات 
البيانات من نوعها غير محددة الهوية على أرض الواقع والمتوافقة مع -HIPAA‏ 

ويمكن استخدام EMRS‏ لتطوير تطبيقات تحليلية متعددة. وأحد هذه التطبيقات 
هو فهم العلاقات بين الأمراض على أساس المعلومات حول الأمراض المتزامنة (التي b‏ 
في وقت واحد) المتقدمة في المرضى. فعندما يصاب مريض واحد بعدة أمراضء فإن 
هذه الحالة تسمى اعتلال مشترك. ومن الممكن أن تكون الأمراض المصاحبة مختلفة 
عبر المجموعات السكانية. s‏ هذه الحالة العملية. قامت مجموعة بحثية في جامعة 
أوكلاهوما الحكومية بعمل مقارنة بين الأمراض المصاحبة في المرضى من المناطق الحضرية 
والأمراض المصاحبة في المرضى من المناطق الريفية. 

وللمقارنة بين الأمراض dom Lal]‏ فقد تم تطبيق نهج تحليل الشبكة. وتتألف 
الشبكة من مجموعة محددة من العناصر تسمى Ail‏ وترتبط هذه العقد ببعضها 
البعض من خلال الحواف؛ حيث تمثل الحافة علاقة محددة بين العٌقد. ومن أكثر الأمثلة 
شيوعًا على الشبكة. مثال شبكة صداقة يتواصل فيها الأفراد مع بعضهم البعض في حالة 
ما إذا كانوا أصدقاء. وعلى نحو ilaa‏ فهناك شبكات أخرى مشتركة Jis‏ شبكات 
الحاسب» وشبكات صفحات الويب» بالإضافة إلى شبكات الطرقء وشبكات المطارات. 
ولمقارنة الأمراض المصاحبةء فقد تم تطوير الشبكات الخاصة بالأمراض في المرضى من 
المستشفيات الريفية والحضرية. وقد استُخدمت المعلومات المتعلقة بالأمراض والتي 
طورها كل مريض خلال زيارات المستشفى لإنشاء شبكة للمرض. وقد بلغ إجمالي 
عدد زائري المستشفيات في المستشفيات الحضرية TI‏ مليون» في حين بلغ إجمالي عدد 
الزائرين في المستشفيات الريفية ١‏ مليون شخص. ولإدارة مثل هذه المجموعة الضخمة 
من البیانات» تم استخدام منصة البيانات الضخمة Teradata Aster‏ كما استُخدمت 
أطر SQL-GRs -SQL-MRs SQL‏ والمدعومة بواسطة „Aster‏ أيضًا فقد استخدم 
Gephis Aster AppCenter‏ لتصوير الشبكات Dya‏ 

ويعرض الشكل )١١-1(‏ شبكات الإصابة المرضية المشتركة الريفية والحضرية. حيث 
تمثل العْقد في هذه الشبكات. الأمراض المختلفة المصنفة بحسب التصنيف الدولي 
للأمراضء المراجعة التاسعةء التعديل السريري (ICD-9 CM)‏ مجمعة على diua‏ 
ثلاثة أرقام» حيث يتم الربط بين اثنين من الأمراض في حالة ما إذا LIS‏ مرتبطين بشكل 
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كبير أو بشكل مرضي )0.01 > (p‏ وكلما زاد حجم العقدة. دل ذلك على زيادة الإصابة 
بالمرض. الجدير بالذكر أن كثافة شبكات الإصابة المرضية الحضرية أكثر من كثافة 
الشبكة الريفية؛ حيث يبلغ عدد العقد والحواف في الشبكة الحضرية YY Yaa ۱,۰٤۳‏ 
على التواليء في حين أن عدد العقد والحواف في الشبكة الريفية Y,- V5 ٩٩۳ à La‏ 
على «isi‏ مما يدل على أن تشخيص امرضى في المستشفيات الريفية IS‏ ما يشير 
إلى وجود عدد أقل من الأمراض المتزامنة. وتعرض التصويرات فرقًا واضحًا بين مط 
الأمراض المتقدمة ف المناطق الحضرية والريفيةء مما يستدعي العديد من Al LI‏ 
المتعلقة بالسياسات الطبية والاجتماعية والتي تتطلب المزيد من البحث والتحليل. 
وعلى الجانب الآخرء فقد قمنا بتضمين هذا التحليل لزيادة الوعي أيضًا بقضية أخرى. 
وقد لاحظنا مبكرًا أن مجموعة البيانات المستخدمة لهذا التحليل شملت T dise‏ 
مليون لقاء مع المرضى في المناطق الحضرية و١‏ مليون لقاء فقط مع ال مرضى في المناطق 
الريفية. وعلى الأرجح فإن هذا الاختلاف الكبير يرجع لعدم قدرة معظم المستشفيات 
الريفية على تحمل تكاليف نظام السجلات الطبية الإلكترونية الكبرى مثل «Cerner‏ 
وبالتالي فإن البيانات تميل نحو المستشفيات الحضرية. غير أن أي أفكار نتجت عن هذه 
العينة سوف يتم التشكيك فيها. وكما ذكرنا في الفصل الرابع» فإنه رها تم سحب عينة 
متناسبة من المناطق الحضرية وتمت مقارنتها بسجلات المرضى الريفيين. 
xL 2‏ 

ص امراض الغدد الصماء والتغذية 

والتمثيل الغذائي واضرابات المناعة 
أمراض الدم واعضاء تشكيل الدم 


الإضطرابات العقلية 
أمراض الجهاز العصبي 





أمراض الجهاز البولي التناسلي 








C3‏ الاسباب الخارجية للإصابة 
والتصنيف الإضافي 




















شكل :1١-۷‏ شبكات الأمراض المشتركة بين الحضر والريف 
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وستتحمل نظم قواعد البيانات التقليدية جهدًا في تجهيزها بكفاءة للبيانات 
الضخمة. وقد قام Teradata Aster‏ بتحليل البيانات التي تحتوي على معلومات 
عن ۸٤‏ مليون زيارة و۲۰۰ مليون سجل سريع وسهل إلى حد ما. وغالبًا ما يتم 
اقتراح تحليل الشبكة على اعتبار أنه طريقة واحدة لتحليل مجموعات البيانات 
الضخمة؛ فهو يساعد على فهم البيانات في صورة واحدة. في هذه الحالة العملية 
تبين شبكة الإصابة المرضية المشتركة العلاقة بين الأمراض في مكان واحد. 
أسئلة للمناقشة: 
BLA -١‏ يمكن أن تكون الإصابة المشتركة للأمراض مختلفة بين المستشفيات في 
الريف وفي الحضر؟ 
-Y‏ ما هي مسألة الفرق الكبير بين مواجهات ish‏ في كل من المناطق الريفية 
والحضرية؟ 
؟- ما هي المكونات الرئيسة للشبكة؟ 
£- أين أيضًا يمكنك تطبيق نهج الشبكة؟ 
Source: Kalgotra, P., & Sharda, R. (2016). Rural versus urban comorbidity networks.‏ 
Working Paper, Center for Health Systems and Innovation, Oklahoma State University.‏ 
كما يزداد الدور الذي تلعبه السحابة في سوق البيانات الضخمة. ويقوم كل من Googles Amazon‏ 
بدعم عمليات نشر هادوب في عروض السحابة العامة. أما Googles Amazon Elastic MapReduce‏ 
Compute Engine‏ على التوالي» فإنهما يقومان بتمكين الممستخدمين من توسيع النطاق وتقليل حجم 
المجموعات بسهولة حسب الحاجة. وتقوم مايكروسوفت (Microsoft)‏ بدعم توزيع هادوب الخاص 
بهورتنورك في سحابة Azure‏ وفي الفصل التالي سوف نناقش العروض القائمة على السحابة. 
كما ينتهج Ua‏ موردون آخرون نهج البيانات الضخمة من زاوية التحليلات المرئية. وكما يشير 
Magic Quadrant‏ أحدث إصدارات Gartner‏ فإن هناك 156 Bus‏ في ذكاء الأعمال والتحليلات 
في الاستكشافات والتحليلات المرئية. وتقوم الشركات الكبيرة مثل SAP SAS‏ و18۷1 بجانب 
شركات صغيرة غير أنها مستقرة مثل QlikViewg .TIBCO Tableau‏ بتقديم حالة قوية 
لتحليلات الأداء العالي الموجودة في منصات تصوير المعلومات. وتقدم رؤية فنية (P-V)‏ عددًا 
قليلًا من العوامل المساعدة الرئيسة لتحقيق النجاح مع البيانات الضخمة والتحليلات المرئية. 
وربما يكون SAS‏ هو الدافع لها بقوة أكثر من أي شيء آخر مع منصته التي ظهرت مؤخرًا وهي 
5 للتحليلات المرئية. وقد سبق تقدهه في الفصل الثاني. وباستخدام العديد من التحسينات 
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الحسابية يستطيع برنامج التحليلات المرئية SAS‏ تحويل عشرات الملايين من سجلات البيانات إلى 
رسومات بيانية معلوماتية خلال بضع ثوان فقط باس تخدام ا معالجة المتوازية الواسعة (MPP)‏ 
والحوسبة داخل الذاكرة. 


رؤية فنية ۳-۷ 
كيف تنجح مع البيانات الضخمة 

من البيت الأبيض وحتى منزلك يصعب العثور على منظمة أو شخص لديه esl‏ بيانات 
أقل من عام gha‏ حيث تتزايد خيارات قاعدة البيانات» كما يتطور ذكاء الأعمال نحو عهد 
جديد من التحليلات على مستوى المنظمة: بالإضافة إلى أن كل شيء يتحرك ولا يبقى ls‏ 
في مكانه. فالمنظمات التي استطاعت تكييف هيكل البيانات الخاص بها وعملياتها بنجاح 
من أجل معالجة الخصائص الثلاثة للبيانات الضخمة - الحجم» والتنوع» والسرعة - تعمل 
على تحسين الكفاءة التشغيلية: وتزايد الإيرادات» بالإضافة إلى تمكين نماذج أعمال جديدة. 
والحقيقة أن معدل التغيير سوف يتحقق فقط مع كل المنظمات التي تهتم بوضعها الذي 
يتعلق بالابتكار في كل ما يخص البيانات. إذَا ما الذي يجب على الشركات فعله حتى 
تحقق النجاح مع البيانات الضخمة؟ وفيما يلي بعض من التوصيات الصناعية: 
-١‏ التبسيط: إنه لمن الصعب أن تتم متابعة جميع موردي قواعد البيانات الجدد. 
وجميع المشاريع المجانيةء وجميع مقدمي خدمات البيانات الضخمة:. بالإضافة إلى 
أن كل هذه الأشياء سوف تزداد ازدحامًا وتعقيدًا في الأعوام المقبلة. ومن ثم» فهناك 
حاجة ماسة للتبسيط. فمن الضروري اتباع نهج إستراتيجي من خلال توسيع نطاق 
نظمة معالجة المعاملات العلائقية والاتصال عبر الإنترنت الخاصة بك إلى واحد أو 
أكثر من البرامج الجديدة المُستضّافة داخل المؤسمة: أو خيارات قاعدة البيانات 
d EU‏ على الخدمة والتي تعكس احتياجات صناعتك ومنظمتك على أكمل وجه. 
ومن ثم اختيار منصة ذكاء الأعمال الذي يدعم الاتصالات المباشرة للعديد من قواعد 
البيانات وتنسيقات الملفات في الوقت المناسب. ومن الجدير بالذكر أن اختيار 
فضل مزيج من بدائل الحلول لكل مشروع (ما بين الاتصال المباشر بقواعد البيانات 
لسريعة وتلقي مستخرجات البيانات في داخل محرك التحليلات في الذاكرة لتعويض 
ela‏ قواعد البيانات البطيئة أو المثقلة بالأعباء) هو أمر بالغ الأهمية لنجاح أي 
مشاريع بيانات ضخمة. فعلى سبيل المثال: تتألف بنية تحليلات البيانات الضخمة 





من تيراداتا (وهي إحدى أشهر شركات مستودعات (OLLI‏ وهادوب (وهو Jdal‏ 
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الأكثر نجاحًا لتحدي البيانات الضخمة)ء بالإضافة إلى Tableau‏ (وهو أحد موردي 
حلول التحليلات البصرية غزيرة الإنتاج). ويمكن مموظفي eBay‏ تصوير الأفكار من 
أكثر من OY‏ بيتابايتس من البيانات. ويستخدم eBay‏ حل التحليلات المرئية بواسطة 
Tableau‏ لتحليل مدى ملاءمة البحث وجودة موقع eBay‏ الذي يقوم بمراقبة أحدث 
ملاحظات العملاء وقياس ميولهم» بالإضافة إلى تحقيق التقارير التشغيلية لأنظمة 
مستودعات البيانات» وقد ساعد كل ذلك على نجاح الثقافة التحليلية داخل „eBay‏ 

-Y‏ التعايش: إن استخدام نقاط القوة لكل منصة قاعدة بيانات» وتمكينها من التعايش 
في بنية بيانات مؤسستك لهو أمر ضروري. وهناك العديد من الكتابات التي تحدثت 
عن ضرورة الحفاظ على التعايش بين مستودعات البيانات التقليدية وقدرات 
المنصات الجديدة وتعهده بالرعاية. 

-Y‏ التصوير: بالنسبة للشركات الرائدة في أبحاث التحليلات مثل شركتي «Forrester‏ و 
Gartner‏ فإن المؤسسات تتحرى أن يكون لديها منصات متقدمة لتصوير البيانات 
من أجل أن تكون أدوات أساسية eS‏ من مراقبة الأعمالء والعثور على «UI‏ 
واتخاذ إجراءات لتجنب التهديدات واقتناص الفرص. وتساعد التحليلات البصرية 
المنظمات في الكشف عن الاتجاهاتء والعلاقات» والعيوب عن طريق التحول AA‏ 
من خلال كميات كبيرة جدًا من البيانات. ولتجربة التحليل المرئي خصائص معينة؛ 
فهي qus‏ لك القيام بشيئين في أي iod‏ وهما: 
- تغيير البيانات التي تبحث عنها بشكل فوري. وتكمن أهمية هذا الأمر في كون 

الأسئلة المختلفة تتطلب بيانات مختلفة. 
- تغيير الطريقة التي تنظر بها إلى البيانات بشكل فوري. ويُعد ذلك مهما OS‏ كل 
عرض قد يجيب عن أسئلة مختلفة. 

وهذا المزيج يُحدث التجربة الاستطلاعية المطلوبة لأي شخص للإجابة على الأسئلة 
بسرعة. وهذه التجربة في جوهرها تؤدي إلى أن يصبح التصوير البصري امتدادًا 
طبيعيًا لعملية التفكير التجريبي. 

All إلى جنب مع خدمة ذكاء الأعمال‎ Ui التمكين: تسير البيانات الضخمة‎ -٤ 
فإن «قيمة التحليلات والبيانات‎ Bage التي دُشرت‎ Aberdeen لمجموعة‎ Liss 
الضخمة تزداد إلى أقصى حد». ومن الجدير بالذكر أن المنظمات التي لديها بيانات‎ 
BI في إحتمالية أن يكون لديها مشاريع‎ *7١ ضخمة تمتلك فرصة تفوق نسبة‎ 
آكثر من المنظمات الأخرى والتي يتم توجيهها من قبل مجتمع الأعمالء وليس‎ BA 
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من قبل مجموعة تقنية ا لمعلومات. وعبر مجموعة من الاستخدامات من معالجة 
مشاكل الأعمال الجديدة. وتطوير منتجات وخدمات جديدة بالكاملء والعثور على 
الذكاء القابل للتطبيق في أقل من delw‏ ومزج البيانات من مصادر متباينة تجعل 
لبيانات الضخمة تطلق العنان ما هو ممكن من خلال تطبيق التحليلات. 
0- التكامل: يُعد تكامل ومزج البيانات من مصادر مختلفة Kjo‏ أساسيًا من تحليلات 
البيانات الضخمة لمنظمتك. فالمنظمات التي هكنها مزج مصادر بيانات أولية, 
علائقية مختلفة. وشبه مهيكلةء في الوقت المناسبء وبدون تكاليف دمج أولية 
باهظة الثمنء هي المنظمات ذات أفضل قيمة من البيانات الضخمة. ومجرد حدوث 
الدمج والمزج» فإن هيكل البيانات (مثل: جداول البيانات» أو قاعدة البيانات» أو 
مستودع البيانات» أو نظام ملفات مجاني مثل هادوب» أو جميعها في نفس الوقت) 
يصبح غير مهم؛ وهذا يعني أنك لست بحاجة إلى معرفة تفاصيل كيفية مستودعات 
البيانات لطرح الأسئلة والإجابة عليها. وكما رأينا في حالة عملية (£-V)‏ أن حملة 
وباما وجدت طريقة لدمج وسائل التواصل الاجتماعيء والتقنيةء وقواعد بيانات 
لبريد الإلكترونيء وجمع البيانات» وبيانات السوق الاستهلاكية لعمل ميزة تنافسية. 
الحوكمة: llla)‏ كانت حوكمة البيانات مشكلة صعبة في مجال تقنية المعلومات» 
ومع ظهور البيانات الضخمة أصبح الأمر أكثر حيرة. وهناك أكثر من ۸٠‏ دولة لديها 
قوانين لخصوصية البيانات. وقد حدد الاتحاد الأوروبي سبعة «مبادئ خصوصية للملاذ 
الآمن» لحماية بيانات مواطنيهم الشخصية. ففي سنغافورة بدأ تفعيل قانون حماية 
البيانات الشخصية في يناير às Y-W‏ الولايات المتحدة الأمريكيةء يؤثر Sarbanes-‏ 
Oxley‏ على جميع الشركات المدرجة في البورصة» ويضع قانون HIPAA‏ (قانون نقل 
التأمين الصحي والمُساءلة وقابلية النقل) المعايير الوطنية في مجال الرعاية الصحية. 
ويختلف التوازن الصحيح بين التحكم والتجريب تبعًا لاختلاف التنظيم والصناعة. 
ويبدو أن أفضل ممارسات إدارة البيانات الرئيسة تساعد في إدارة عملية الحوكمة. 
-V‏ التبشير: فمن خلال الحصول على دعم من واحد أو أكثر من الرعاة التنفيذيين» 
يستطيع Mis Q3 jill‏ الحصول على الكرة المتداولة وغرس مجموعة فاضلة: فكلما 
olj‏ عدد الإدارات في منظمتك والتي تحقق فوائد قابلة للتطبيق» تصبح التحليلات 
أكثر انتشارًا عبر منظمتك. وتعد التحليلات المرئية السريعة والسهلة في الاستخدام 
هي المفتاح الذي يفتح الباب ell‏ تبني التحليلات والتعاون على نطاق المنظمة. 
Sources: Lampitt, A. (2012). Big data visualization: A Big deal for eBay. infoworld.‏ 
com/d/Big-data/Big-data-visualization-Big- deal-ebay-208589 (accessed August‏ 
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2016). Tableau white paper. (2012). 7 Tips to Succeed with Big Data in 2013. 
cdnlarge.tableausoftware.com/sites/default/files/whitepapers/7-tips-to-succeed- 


with-Big-data-in-2013.pdf (accessed August 2016). 


أسئلة للمراجعة على القسم N-V‏ 

-١‏ ما المقصود بمشهد موردي البيانات الضخمة؟ ومن هم اللاعبون الكبار؟ 

-Y‏ في رأيك كيف سيتغير مشهد موردي البيانات الضخمة في المستقبل القريب؟ وماذا؟ 
*- ما دور التحليلات المرئية في ble‏ البيانات الضخمة؟ 


V-V‏ البيانات الضخمة وتحليلات التيار: 


as‏ السرعة من أهم الخصائص الرئيسة التي تيز البيانات الضخمة إلى جانب خاصيتي الحجم 
والتنوع, GLUI‏ رأيناهما سابقًا في هذا الفصلء وتشير السرعة هنا إلى السرعة التي يتم بها إنشاء 
البيانات وتدفقها إلى بيئة التحليلات. وتبحث المنظمات عن وسائل جديدة els‏ تيار البيانات 
عندما Gb‏ للاستجابة بسرعة وبدقة على المشاكل والفرص من أجل إرضاء عملائهم والحصول على 
ميزة تنافسية. وفي الحالات التي db‏ فيها تيارات البيانات بشكل سريع وبصورة مستمرة فإنه 
CI‏ ما تصل طرق التحليل التقليدية التي تعمل مع البيانات المتراكمة سابقًا (أي البيانات في حالة 
الراحة) إلى قرارات خاطئة بسبب استخدام الكثير من البيانات خارج السياق» أو تصل هذه الطرق 
إلى القرارات الصحيحةء ولكن بعد فوات الوقت الذي تحتاج المنظمة إلى استخدامها فيه. لذلك؛ 
فإنه من المهم في العديد من مواقف العمل أن يتم تحليل البيانات بعد وقت قصير من إنشائها 
و / أو بمجرد أن يتم بثها في نظام التحليلات. 

ومن المفترض أن أغلب الأعمال في العصر الحديث تعيش Glo‏ على مبدأ أنه من المهم 
والضروري تسجيل كل جزء من البيانات؛ لأنه رها يحتوي على معلومات قيمة قد يحتاج إليها 
العمل الآن أو في وقت ما في المستقبل القريب. وكيفما يزداد عدد مصادر البيانات» فإن نهج 
«تخزين كل شيء» يصبح أصعب وأصعبه بل إنه قد يكون غير ممكن في بعض الحالات. ds‏ 
الواقع. فإنه على الرغم من التقدم التقنيء إلا أن سعة التخزين الإجمالية الحالية تختلف DiS‏ 
عن المعلومات الرقمية التي يتم إنتاجها في العام. وعلاوةٌ على ذلك فإن الكشف المستمر عن 
التغييرات ذات الدلالة ف البيانات بالإضافة إلى الاختلافات الُعقدة DLSU‏ ضمن نافذة زمنية 
قصيرة معينة في الوقت المناسب في بيئة الأعمال المتغيرة» يُعد Dol‏ ضروريًا للتوصل إلى الإجراءات 
التي تتلاءم بشكل أفضل مع البيئة الجديدة. ومما سبق يتبين أن كل هذه الحقائق التي ذكرت 
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تعد هي المحفز الرئيس لظهور نموذج يُسمى بتحليلات التيار. وقد ظهر نموذج تحليلات التيار 
كاستجابة لكل هذه التحديات» وبالتحديد. التدفقات غير المحدودة من البيانات التي لا هكن 
تخزينها بشكل دائم ليتم تحليلها لاحقًاء ف الوقت اممناسب وبكفاءة. بالإضافة إلى تحدي التغيرات 
النمطية المعقدة التي تحتاج إلى الكشف عنها والتصرف فور حدوثها. 

ويُستخدم مصطلح تحليلات التيار (ويس مى أيضًا تحليلات البيانات في الحركة والتحليلات 
الفورية للبيانات) Sole‏ من أجل العملية التحليلية الخاصة باستخراج معلومات قابلة للتطبيق 
من بيانات التيار / البيانات المتدفقة بشكل متواصل. ويُعرف التيار بأنه تسلسل مستمر لعناصر 
البيانات Zikopoulos)‏ وآخرونء Les (Y-Y‏ ما ُسمى pols‏ البيانات في مجموعة ما 
بالصفوف tuples‏ بمعنى قاعدة البيانات العلائقية. حيث يشبه tuple‏ صفًا من البيانات adou)‏ 
موضوع. مثال). ومع ذلك فإنه في سياق البيانات شبه اللهيكلة أو غير lS all‏ فإن tuple‏ هو 
عبارة عن تجريد هثل حزمة من البيانات» والتي هكن وصفها بأنها مجموعة من السمات مموضوع 
معين. فإذا كان tuple‏ بحد ذاته غير واف بابمعلومات الكافية للتحليل أو الارتباط أو العلاقات 
الجماعية الأخرى بين الصفوف المطلوبة» فعندئذ يتم استخدام نافذة للبيانات تتضمن مجموعة 
من الصفوف tuples‏ هذه النافذة من البيانات عبارة عن عدد / تتابع محدود من الصفوف 
tuples‏ حيث يتم تحديث النوافذ باستمرار كلما توافرت بيانات جديدة. ويتم تحديد حجم 
النافذة tly‏ على النظام الجاري تحليله. وقد أصبح انتشار تحليلات التيار متزايدًا لسببين. أولهماء 
أن قيمة وقت العمل أصبحت في تناقص مستمرء وأما ثانيهماء Ul‏ لدينا الوسائل التقنية لالتقاط 
ومعالجة البيانات أثناء إنشائها. 

وقد تم تطوير بعض التطبيقات التي تُعد أكثر تطبيقات تحليلات التيار تأثيرا في صناعة الطاقة, 
وتحديدًا من أجل أنظمة الشبكات الذكية (سلسلة إمدادات الطاقة الكهربائية). فالشبكات 
الذكية الجديدة لا يمكنها فقط إنشاء ومعالجة تيارات متعددة للبيانات في الوقت المناسب من 
أجل التوزيع الأمثل للطاقة ADU,‏ احتياجات العملاء الحقيقية: بل إنها leS Lal‏ إنشاء تنبؤات 
دقيقة على المدى القصير تهدف إلى تغطية الحاجات الملحة غير المتوقعة وتوليد الطاقة المتجددة. 
ويوضح الشكل (VY-V)‏ صورة حالة استخدام dale‏ لتحليلات التيار في صناعة الطاقة (تطبيق 
الشبكة الذكية النموذجي)»» والغرض من ذلك هو التنبؤ بدقة بالطلب على الكهرباء وإنتاجها 
في الوقت المناسب باستخدام بيانات التيار التي توفرها العدادات الذكية وأجهزة استشعار نظام 
الإنتاج ونماذج الرصد. ويمكن استخدام كل من القدرة على التنبؤ باتجاهات الاستهلاك / الإنتاج 
في uis ull‏ القريب بالإضافة إلى اكتشاف الحالات الشاذة في الوقت المناسب من أجل تحسين 
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قرارات التوريد (كمية الإنتاج» وموارد الإنتاج المستخدمة. وتعديل قدرات الإنتاج على النحو 
الأمثل) بالإضافة إلى ضبط العدادات الذكية لتنظيم الاستهلاك والتسعير الملائم للطاقة. 





قرارات السعة نظام إنتاج الطاقة 
( تقليدى وقابل للتجديد) | 
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شكل Y-Y‏ حالة استخدام تحليلات التيار في صناعة الطاقة 


تحليلات التيار مقابل التحليلات الدائمة: 

قد يبدو لمعظم الناس أن كلا المصطلحين التيار والدائم هما الشيء نفسه. كما أنهما يستخدمان في 
كثير من الحالات بشكل مترادفء غير أنه يوجد اختلاف بينهما في سياق الأنظمة الذكية )2007 (Jonas,‏ 
فتحليلات التيار تنطوي على تطبيق منطق مستوى المعاملات إلى المشاهدات الفورية؛ حيث إن 
القواعد المطبقة على هذه الملاحظات تأخذ في اعتبارها الملاحظات السابقة UU‏ أنها وقعت في 
النافذة المقررة؛ وتحتوي هذه النوافذ على حجم عشوائي (مثل: آخر 0 iol‏ وآخر ٠١٠٠١‏ ملاحظة). 
وعلى الجانب الآخرء فإن التحليلات الدائمة تقوم بتقييم كل مشاهدة واردة في مقابل كل المشاهدات 
السابقةء حيث لا يوجد حجم نافذة. ومن الجدير SUL‏ أن التعرف على كيفية ارتباط المشاهدة 
الجديدة بجميع المشاهدات السابقة GSF‏ من تكوين رؤية في الوقت المناسب. 

ولكل من تحليلات التيار والتحليلات الدائمة مزاياها وسلبياتها وأماكنها الخاصة في عام تحليلات 
الأعمال. فعلى سبيل JUL‏ أحيانًا تكون أحجام المعاملات كبيرة للغاية ويكون وقت اتخاذ القرار قصياً 
جد مما يؤدي إلى تفضيل عدم الثبات وأحجام النوافذ الصغيرة» والتي ثترجم إلى تحليلات التيار في 
حين أنه عندما تكون المهمة خطيرة ويمكن إدارة وحدات التخزين في الوقت المناسبء فعندئذ تكون 
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التحليلات å éla!‏ هي الخيار الأفضل. وبهذه di hll‏ فإنه هكن الإجابة على A ul‏ من نوع: «ما 
علاقة ما تعلمته للتو ها كنت أعرفه؟» «هل هذا شيء مهم؟» «من الذي يحتاج إلى المعرفة؟». 


معالجة الأحداث الحرجة: 

إن معالجة الأحداث الحرجة هي طريقة التقاطء quis‏ وتحليل تيارات البيانات للكشف عن 
الأحداث (التي تكون خارج الأحداث العادية) لأنواع معينة تستحق الجهد المبذول. وتعد معالجة 
الأحداث المعقدة تطبيقًا لتحليلات التيار والتي يتم فيها جمع البيانات من مصادر متعددة 
لاستنتاج الأحداث أو أنماط الاهتمام إما قبل حدوثها بالفعل أو بمجرد حدوثها. والهدف من ذلك 
هو اتخاذ إجراءات سريعة من أجل منع حدوث الآثار السلبية لهذه الأحداث أو التخفيف منها 
(مثل: الاحتيال أو اختراق الشبكات). أو في حالة وجود بصيص أمل من الفرصةء فيكون الهدف 
هو الاستفادة الكاملة من الموقف في الوقت المسموح به Elu)‏ على سلوك المستخدم على موقع 
التجارة الإلكترونيةء وإنشاء عروض ترويجية والتي يرجح أن يستجيب لها المُستخدم). 

وقد تقع هذه الأحداث الحرجة عبر طبقات مختلفة من المنظمة مثل العملاء ا محتملينء أو 
الطلبات» أو مكالمات خدمة العملاء» أو على نطاق gugl‏ والذي قد يكون polis‏ إخبارية» أو رسائل 
نصيةء أو منشورات وسائل التواصل الاجتماعيء أو تغذيات سوق الأوراق امالية» أو تقارير حركة 
المرورء أو الأحوال الجويةء أو غيرها من أنواع الحالات الشاذة التي قد يكون لها تأثير كبير على 
تحسين حالة المنظمة. كما يمكن Lil‏ تعريف الحدث بشكل عام على أنه «تغيير الحالة» والذي قد 
يتم اكتشافه على أنه قياس يتجاوز بداية محددة في وقت سابقء أو درجة الحرارة أو قيمة أخرى. 
وعلى الرغم من أنه لا يوجد إنكار لاقتراح القيمة الخاصة معالجة الأحداث الحرجة. إلا أنه يتعين 
انتقاء ما يجب قياسه» ومتى يتم القياس» وكم مرة يتم القياس. وبسبب الكم الهائل من المعلومات 
المتوفرة حول «loe M‏ والتي يشار إليها Gol‏ باسم سحابة الحدثء فإن هناك احتمال للمبالغة 
فيهاء وفي هذه الحالة فإنها قد تضر بالفعالية التشغيلية لامنظمة» بدلا من مساعدتها. 


التنقيب في تيار البيانات: 

هكن تعريف التنقيب في تيار البيانات» باعتباره تقنية تمكينية لتحليلات التيارء على أنه عملية 
استخراج DLI‏ الجديدة وهياكل المعرفة من سجلات البيانات السريعة والمتواصلة. وكما رأينا 
في فصل التنقيب في البيانات (الفصل الرابع)» فإن الطرق التقليدية للتنقيب في البيانات تتطلب 
جمع البيانات وتنظيمها في شكل ملف مناسبء ثم يتم معالجتها بطريقة متكررة لمعرفة الأماط 
الأساسية. وعلى النقيض من «US‏ فإن تيار البيانات هو تدفق مستمر لتسلسل مرتب من النماذج 
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التي يمكن قراءتها / معالجتها في كثير من التطبيقات الخاصة بالتنقيب في تيار البيانات مرة واحدة 
فقط أو عدد قليل من المرات باستخدام قدرات محدودة للحوسبة والتخزين. وتشتمل أمثلة تيار 
البيانات على بيانات جهاز الاستشعارء وزيارات شبكة الحاسب» وال محادثات الهاتفية. ومعاملات 
ATM‏ وبحث الويب» والبيانات المالية. ويعتبر التنقيب في تيار البيانات حقلا فرعيًا من التنقيب 
في البيانات» وتعلم E‏ واكتشاف المعرفة. ١‏ 

ويتمثل الهدف في العديد من تطبيقات التنقيب في تيار البيانات» في التنبؤ بالدرجة أو القيمة 
الخاصة بالنماذج الجديدة في تيار البيانات التي توفر بعض المعرفة حول عضوية الفئة أو قيم 
النماذج السابقة في تيار البيانات. ويمكن استخدام أساليب تعلم الآلة المتخصصة (ومعظمها 
مشتقة من أساليب تعلم الآلة التقليدية) لتعلم مهمة التنبؤ من الأمثلة المصنفة بطريقة آلية. 
وقد قام كل من Kimg .Kletkes Delen‏ )2005( بتطوير مثال على طريقة التنبق حيث قاموا 
تدريجيًا ببناء وصقل نموذج لشجرة القرار باستخدام مجموعة فرعية من البيانات في وقت واحد. 
أسئلة للمراجعة على ۷-۷: 
-١‏ ما هو التيار )$ ble‏ البيانات الضخمة)؟ 
-Y‏ ما هي الدوافع لتحليلات التيار؟ 
-Y‏ ما هي تحليلات التيار؟ وكيف تختلف عن التحليلات العادية؟ 
-E‏ ما هي معالجة الأحداث الحرجة؟ وكيف ترتبط بتحليلات التيار؟ 
0- عرف التنقيب في تيار البيانات. ما هي التحديات الإضافية التي يطرحها التنقيب في تيار البيانات؟ 


A-V‏ تطبيقات تحليلات التيار: 

إن استخدام تحليلات التيار يتخذ اتجاهًا متزايدًا بشكل yS‏ وذلك نظرًا لقدرته على إحداث 
رؤية حاليةء مما يساعد صانعي القرار على التواجد على قمة الأحداث عندما يتوسعونء الأمر 
الذي يتيح للمنظمات معالجة القضايا قبل أن تتحول إلى مشكلات. وفيما ياي بعض مجالات 
التطبيق التي استفادت بالفعل من تحليلات التيار. 
التجارة الإلكترونية: 

تحاول العديد من الشركات تحقيق أقصى استفادة من البيانات التي تجمعها أثناء وجود 
العميل على موقع الويب الخاص بهاء مثل شركة Amazon‏ وشركة eBay‏ (من بين العديد من 
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الشركات الأخرى). حيث يتم تسجيل وتحليل كل صفحة تتم زيارتهاء وكل منتج تمت مشاهدته. 
وكل عملية بحث «cael‏ بالإضافة إلى كل نقرة يتم عملهاء وذلك لزيادة القيمة المكتسبة من 
زيارة المستخدم. فإذا تم القيام بذلك بسرعةء فإن تحليل مشل هذا التيار من البيانات يمكنه 
تحويل المتصفحين إلى مشترين والمشترين إلى مدمني تسوق. فعندما نقوم بزيارة موقع للتجارة 
الإلكترونية على الويب» حتى وإن لم نكن أعضاءً فيه فإننا بعد عدة نقرات» ندا في الحصول 
على عروض أسعار منتجات وحزم مثيرة للاهتمام بشكل كبير. ويتم خلف الكواليس بشكل 
فوري إجراء التحليلات المتقدمة للبيانات الناتجة عن نقراتناء وآلاف النقرات من الآخرين» 
«لفهم» ما نحن مهتمون به (في بعض الحالات» حتى ولو م نكن نعرف ذلك) وتحقيق أقصى 
استفادة من هذه المعلومات من خلال تقديم عروض إبداعية. 
الاتصالات الهاتفية: 

إن حجم البيانات التي db‏ من سجلات تفاصيل المكاللمات (CDR)‏ لشركات الاتصالات» أمر 
مدهش. وعلى الرغم من أن هذه المعلومات قد استُخدمت لأغراض إعداد الفواتير منذ فترة 
ليست بالقصيرة, إلا أن هناك ثروة من المعرفة المدفونة في عمق هذه البيانات الضخمة والتي 
تدركها شركات الاتصالات الآن. فعلى سبيل «JULI‏ يمكن تحليل بيانات gib CDR‏ تحول العملاء 
إلى شركة أخرى عن طريق تحديد الشبكات الخاصة بالمتصلين, والمؤثرين. والقادة والمتابعين 
داخل هذه الشبكات والعمل على هذه المعلومات بشكل استباقي. وكما نعلم جميعًاء فإن 
للقادة وللمستخدمين المؤثرين تأثيرًا كبيرًا في تغيير نظرة المتابعين داخل شبكتهم نحو مقدم 
الخدمةء سواء بشكل إيجابي أو سلبي. وتقوم شركات الاتصالات بتحديد القادة وأصحاب النفوذ 
والمشاركين في شبكاتهم لإدارة قاعدة عملائهم بشكل أفضل وذلك باستخدام أساليب تحليل 
الشبكات الاجتماعية. كما يمكن بالإضافة إلى ذلك استخدام هذه المعلومات أيضًا لاستقطاب 
أعضاء جدد ورفع قيمة الأعضاء الحاليين إلى أقصى حد. 

ويمكن دمج التيارات المستمرة من البيانات التي db‏ من CDR‏ مع بيانات وسائل التواصل 
الاجتماعي (تحليل المشاعر) من أجل تقييم فعالية الحملات التسويقية. كما يمكن استخدام 
الأفكار المكتسبة من هذه التيارات الخاصة بالبيانات للتفاعل السريع مع التأثيرات الضارة (التي 
قد تؤدي إلى فقدان العملاء) أو تعزيز وقع التأثيرات الإيجابية المشاهدة في هذه الحملات (والتي 
قد تؤدي إلى تعظيم عمليات الشراء للعملاء الحاليين واستقطاب عملاء جدد). bles‏ على 
«US‏ فإنه يمكن تكرار عملية اكتساب الأفكار من CDR‏ من أجل شبكات OLLI‏ التي تستخدم 
سجلات تفصيلية لبروتوكول الإنترنت. ونظرًا لقيام معظم شركات الاتصالات بتوفير كلا النوعين من 
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هذه الخدمات» فإن التحسين الشامل لجميع العروض والحملات التسويقية قد يؤدي إلى مكاسب 
استثنائية في السوق. وتُعد حالة عملية (V-V)‏ مثالا على كيفية فهم Salesforce.com‏ لعملائه 
بشكل أفضل من خلال الاعتماد على تحليل تيارات النقر. 


حالة عملية ۷-۷ 
استخدام Salesforce‏ لتيار البيانات لتحسين قيمة العميل 

وسعت شركة Salesforce‏ خدمات السحابة التسويقية الخاصة بها لتشمل النتائج 
التنبؤية ومميزات الجمهور التنبؤية وتسمى بالتسويق السحابي التنبؤي. وتستخدم هذه 
الإضافة بيانات التيار الفورية لتحسين تفاعل العملاء عبر الإنترنت. sl‏ يحصل العملاء 
على درجة تنبؤية فريدة og‏ ويتم احتساب هذه النتيجة من عدة عوامل مختلفة. 
وتشمل كلا من طول مدة Jau‏ التصفح» وما إذا كانوا قد قاموا بالنقر على رابط البريد 
الإلكترونيء وما إذا كانوا قد قاموا بشراء مادي, وكم أنفقواء ومنذ متى قاموا بالشراء وما 
إذا كانوا قد استجابوا لأي بريد إلكتروني أو حملة إعلانية. وبمجرد حصول العملاء على 
درجة» يتم تقسيمهم إلى مجموعات مختلفة؛ حيث يتم إعطاء هذه المجموعات Éh‏ 
وأهدافًا تسويقية مختلفة Blaze!‏ على السلوكيات التنبؤية الخاصة بكل منهم» ويتم 
تحديث الدرجات والشرائح وتغييرها يوميًا مع إعطاء الشركات خارطة طريق أفضل 
لاستهداف وتحقيق الاستجابة المطلوبة. وتعد هذه الحلول التسويقية أكثر دقة كما أنها 
تتيح Éb‏ أكثر تخصيصًا للشركات والتي يمكنها استيعاب أساليب الاحتفاظ بالعملاء. 

أسئلة للمناقشة: 

-١‏ هل هناك مجالات في أي صناعة يكون فيها تيار البيانات غير ذي صلة؟ 

-Y‏ بخلاف الاحتفاظ بالعملاء ما هي المزايا الأخرى لاستخدام التحليلات التنبؤية؟ 

ماذا نتعلم من هذه الحالة العملية؟ 

تستطيع الشركات من خلال تحليل البيانات التي تم الحصول عليها في المكان والزمان 
المناسبَينء أن تقوم بتنبؤات وتتخذ قرارات بشأن المستهلكين بسرعة ol‏ مما يضمن 
تحقيق أهداف الأعمال. وجذب العملاء المناسبينء والاحتفاظ بهم وتعظيم قيمتهم 
لأقصى حد. ومن الجدير بالذكر أن البيانات التي تم الحصول عليها في الأسبوع الماضي» 
ليست مفيدة مثل البيانات التي لدى الشركات اليوم. كما أن استخدام البيانات ذات 
الصلة يجعل تحليلنا التنبؤي أكثر دقة وكفاءة. 
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Sources: Amodio, M. (2015). Salesforce adds predictive analytics to Marketing Cloud. 
Cloud Contact Center http//www.cloudcon-tactcenterzone.com/topics/cloud 
contact-center/articles/413611-salesforce-adds-predictive analytics-marketing- 
cloud.htm (accessed July 2016). Davis, J. (2015). Salesforce adds new predictive 
analytics to Marketing Cloud. Information Week. http://www.informationweek.com/ 
Big-data/Big-data analytics/salesforce-adds-new-predictive-analytics-to marketing- 
cloud/d/d-id/1323201 (accessed July 2016). Henschen, D. (2016). Salesforce reboots 
Wave Analytics, preps IoT cloud. ZD Net. http://www.zdnet.com/article/salesforce- 
reboots-wave-analytics-preps-iot-cloud/(accessed July 2016). 


تطبيق القانون والحماية الإلكترونية: 

توفر تيارات البيانات الضخمة فرصًا ممتازة لتحسين سبل منع الجريمة. وتطبيق القانون» 
وتعزيز الأمان. فهي توفر إمكانات مذهلة في مجال تطبيقات الأمن التي هكن بناؤها في الفضاء 
مثل الوعي الظرفي الفوريء والمراقبة متعددة الوسائطء وكشف الأمان الإلكتروني» والتصنت على 
المكامات الهاتفية» ومراقبة الفيديوء والتعرف على الوجه Zikopoulos)‏ وآخرون (Y WY‏ 
مجال إنتاج الطاقة: 

تزداد كمية البيانات التي تم جمعها بشكل فوري عن طريق مرافق الطاقةء أضعافًا مضاعفة, 
بسبب زيادة استخدام العدادات الذكية. فقد انتقلت من مرة كل شور لتصبح مرة كل ۱١‏ 
دقيقة (أو بشكل أكثر 5,55( حيث تجمع قراءة العداد كميات كبيرة من البيانات القيمة مرافق 
الطاقة. حيث ترسل هذه العدادات الذكية وغيرها من أجهزة الاستشعار الموضوعة في جميع 
أنحاء الشبكة الكهربائيةء المعلومات إلى مراكز التحكم ليتم تحليلها فور وصولهاء حيث تساعد 
مثل هذه التحليلات شركات المرافق لتحسين قرارات سلاسل التوريد الخاصة بهم (مثل: تعديل 
cds i‏ وخيارات شبكة التوزيع» والشراء أو البيع الفوري) وذلك من خلال الاعتماد على أنماط 
الاستخدام والطلب للمستهلكينء بالإضافة إلى أن شركات المرافق يمكنها دمج بيانات الطقس 
والظروف الطبيعية الأخرى في تحليلاتها لتحسين توليد الطاقة من jalas‏ بديلة (مثل: الرياح» 
والطاقة الشمسية) وتوقع Gof‏ مُقدار الطلب على الطاقة في عمليات الحبيبات الجغرافية 
المختلفة. كما أن هناك فوائد أخرى مشابهة تنطبق على المرافق الأخرى ollis‏ والغاز الطبيعي. 
الخدمات المالية: 

تعد شركات الخدمات المالية من بين أبرز الأمثلة التي يمكن أن توفر تحليلات تيار البيانات 
الضخمة لها قرارات أسرع وأفضلء بالإضافة إلى الميزة التنافسية التي تقدمها لهه وكذلك الرقابة 
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التنظيمية. فهي توفر القدرة على تحليل البيانات السريعة ا متدفقة. والأحجام الضخمة من بيانات 
التداول عندما يكون وقت الاستجابة منخفض للغاية عبر الأسواق والدولء فضلا عن تقدهها لميزة 
هائلة بشأن قرارات الشراء / البيع من النوع جزء من الثانية والتي oS‏ أن تترجم إلى مكاسب مالية 
كبيرة. وبالإضافة إلى قرارات الشراء / البيع ab‏ فإن تحليل البيانات هكنه أيضًا أن يساعد شركات 
الخدمات المالية في مراقبة التجارة بشكل فوري للكشف عن التزوير وغيره من الأنشطة غير القانونية. 
علوم الصحة: 

تستطيع الأجهزة الطبية حديثة العهد (مثل: أجهزة تخطيط القلب و معدات التي تقيس 
ضغط الدم» ومستوى الأكسجين في الدم» ومستوى السكر في الدم» ودرجة حرارة الجسم) أن تنتج 
بيانات تشخيصية / حساسة ذات قيمة عالية بمعدل سريع للغاية؛ حيث إن تسخير هذه البيانات 
وتحليلها فور إنتاجها يقدم فوائد - من النوع الذي نطلق عليه غالبًا «مسألة حياة أو موت» - 
وذلك على عكس أي مجال آخرء فضلًا عن مساعدة شركات الرعاية الصحية لكي تصبح أكثر فعالية 
وكفاءة (مما يترتب عليه أن تصبح هذه الشركات أكثر تنافسية وقادرة على تحقيق أرباح عالية), 
وتعمل تحليلات التيار Lol‏ على تحسين ظروف المرضى وإنقاذ الأرواح. 

تقوم العديد من أنظمة المستشفيات في جميع أنحاء العام بتطوير البنية التحتية للرعاية 
وأنظمة صحية مستقبلية. وتهدف هذه الأنظمة إلى الاستفادة بشكل كامل مما تقدمه التقنية 
بل وأكثر من ذلك. إن استخدام الأجهزة التي تولد بيانات عالية الدقة معدل سريع للغاية» إلى 
جانب أجهزة الحاسب فائقة السرعة التى يمكنها تحليل تيارات البيانات المتعددة بشكل متوازن» 
يؤدي إلى زيادة فرص الحفاظ على سلامة المرضى من خلال سرعة اكتشاف الحالات الشاذة. 
وتهدف هذه الأنظمة إلى مساعدة صانعي القرارات الخاصة بالبشر على اتخاذ قرارات أسرع 
وأفضل من خلال الاطلاع على عدد كبير من المعلومات بمجرد توفرها. 


الحكومة: 

تسعى الحكومات في جميع أنحاء العالم إلى إيجاد طرق ترفع من فعاليتها (من خلال الاستخدام 
الأمشل للموارد المحدودة) وأكثر فاعلية (بتوفير الخدمات التي يحتاجها الناس ويريدونها). ومع 
تحول ممارسات الحكومة الإلكترونية إلى الاتجاه السائد إلى جانب الاستخدام واسع النطاق لوسائل 
التواصل الاجتماعي والوصول إليهاء فإن ذلك يوفر كميات ضخمة من البيانات (المهيكلة وغير 
المهيكلة) لتصبح تحت تصرف الجهات الحكومية. فالاستخدام السليم لتيارات البيانات الضخمة 
في الوقت المناسب هو الذي هيز الجهات الاستباقية ذات الكفاءة العالية عن غيرها من الجهات 
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التي مازالت تستخدم الطرق التقليدية للتفاعل مع المواقف عند حدوثها. كما أن هناك طريقة 
أخرى تستطيع الجهات الحكومية من خلالها الاستفادة من قدرات التحليلات الفورية وهي إدارة 
الكوارث الطبيعية Jio‏ العواصف الثلجيةء والأعاصيرء والرياح الشديدة: وحرائق الغابات من خلال 
مراقبة تيار البيانات الصادر من أجهزة الرادارء وأجهزة الاستشعارء وأجهزة الكشف الذكية الأخرى. 
كما يمكنهم Ul‏ استخدام أساليب مشابهة لرصد جودة OLLI‏ وجودة الهواء» وأنماط الاستهلاك 
واكتشاف أي حالات مختلفة عن المعتاد قبل أن تصبح مشاكل كبيرة. وبالإضافة إلى ما سبق» OB‏ 
هناك مجالًا آخر تستخدم فيه الجهات الحكومية تحليلات التيار وهو مجال المرورء حيث تستخدم 
هذه التحليلات في إدارة حركة المرور في المدن المزدحمة؛ حيث يمكن للجهات الحكومية أن تغير 
إشارات المرور الضوئية وحارات ال مرور لتخفيف الإزعاج الذي تسببه مشاكل الازدحام المروريء 
وذلك باستخدام البيانات الصادرة عن كاميرات تدفق حركة المرورء وبيانات ال GPS‏ التي تصدر 
عن OLSA‏ التجارية» وأجهزة استشعار حركة المرور الموجودة في الطرق. 


أسئلة للمراجعة على القسم A-V‏ 

-١‏ ما هي أكثر الصناعات فائدة لتحليلات التيار؟ 

-Y‏ كيف كن استخدام تحليلات التيار في التجارة الإلكترونية؟ 

-P‏ بالإضافة إلى ما ذكر في هذا القسم» هل يمكنك التفكير في صناعات و / أو مجالات تطبيق أخرى 
يمكن استخدام تحليلات التيار فيها؟ 

-E‏ بالمقارنة مع التحليلات العادية. هل تعتقد أن تحليلات التيار ستحتوي على حالات استخدام 
أكثر (أو أقل) في pas‏ تحليلات البيانات الضخمة؟ lg‏ 


تلخيص لأهم نقاط الفصل: 

- للبيانات الضخمة معانٍ مختلفة بالنسبة للأشخاص ذوي الخلفيات والاهتمامات المختلفة. 

- تتخطى البيانات الضخمة نطاق بيئة الأجهزة المستخدمة و / أو إمكانيات أدوات البرامج 
المستخدمة في جمعها وإدارتها ومعالجتها خلال فترة زمنية مقبولة. 

bole -‏ ما يتم تعريف البيانات الضخمة من خلال ثلاث :V‏ الحجم volume‏ والتنوع variety‏ 


والسرعة velocity‏ 
- يعتبر MapReduce‏ أسلوبًا لتقسيم المعالجة ملفات البيانات الضخمة متعددة الهيكلة عبر 
تجمع كبير من الآلات. 


wi‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


- يعتبر هادوب إطار عمل مجاني ممعالجة وتخزين وتحليل كميات كبيرة من البيانات المقسمة غير ال مهيكلة. 
- يعتبر Hive‏ تخزين بيانات مبني على هادوب - يشبه إطار عمل تم تطويره Yol‏ بواسطة -Facebook‏ 

- يعتبر Pig‏ لغة استعلام مبنية على هادوب تم تطويرها بواسطة -Yahoo‏ 

- تعتبر NoSQL‏ والتي ترمز ل Not Only SQL‏ نموذجًا جديدًا لتخزين ومعالجة كميات 
ضخمة من البيانات غير المهيكلة وشبه المهيكلة ومتعددة الهيكلة. 

- يعتبر عام البيانات Data scientist‏ دورًا جديدً! أو وظيفةٌ جديدة ترتبط عادةً بالبيانات 
الضخمة أو علم البيانات. 

- تعتبر S‏ من البيانات الضخمة ومستودعات البيانات تقنيات متكاملة (وليست متنافسة) للتحليلات. 

- كمجال جديد heus‏ يتطور مورد البيانات الضخمة بشكل Mr gu jo‏ 

- تعتبر تحليلات التيار Stream analytics‏ مصطاحًا يُستخدم Sale‏ لاستخراج المعلومات القابلة 
للتطبيق من مصادر البيانات المتدفقة باستمرار. 

- تعمل التحليلات الدائمة على تقييم كل مشاهدة داخلة في مقابل جميع المشاهدات السابقة. 

- تعتبر معالجة الأحداث الحرجة طريقة لالتقاط وتتبع وتحليل تيارات البيانات لاستكشاف 
أحداث معينة (بخلاف الأحداث العادية) والتي تستحق هذا المجهود. 

- يعرف التنقيب في تيار البيانات» كتقنية تمكينية لتحليلات التيارء على أنه عملية لاستخراج 
bY‏ الجديدة وهياكل ال لعرفة من سجلات البيانات المستمرة والسريعة. 

















مصطلحات أساسية: 

البيانات الضخمة. التنقيب في تيار البيانات. Hive‏ 
تحليلات البيانات الضخمة. -MapReduce -Hadoop‏ 
معالجة الأحداث الحرجة. ملف هادوب المقسم. .NoSQL‏ 
نظام HDFS)‏ التحليلات الذائمة. .Pig‏ 

تحليلات التيار. علماء البيانات. 
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الفصل السابع 


أسئلة للمناقشة: 

-١‏ ما هي البيانات الضخمة؟ وطاذا تعتبر مهمّة؟ ومن أين تأتي؟ 

-Y‏ في biy‏ ما هو مستقبل البيانات الضخمة؟ وهل ستفقد شعبيتها إلى شيءٍ آخر؟ I|‏ كانت 
الإجابة بنعم؛ فماذا سيكون ذلك الشيء؟ 

-Y‏ ما هي تحليلات البيانات الضخمة؟ وكيف تختلف عن التحليلات العادية؟ 

-é‏ ما هي العوامل المهمة لنجاح تحليلات البيانات الضخمة؟ 

0- ما هي التحديات الكبيرة التي يجب مراعاتها عند اعتماد تنفيذ تحليلات البيانات الضخمة؟ 

1- ما هي مشاكل الأعمال الشائعة التي تعالجها تحليلات البيانات الضخمة؟ 

-V‏ في pas‏ البيانات الضخمة. هل نعتبر بصدد نهاية pae‏ مستودعات البيانات؟ وطاذا؟ 

3RDBMS / ما هي حالات استخدام البيانات الضخمة / هادوب ومستودعات البيانات‎ -A 

-A‏ ما هي تحليلات التيار؟ وكيف تختلف عن التحليلات العادية؟ 

-٠‏ ما هي jS]‏ الصناعات المجدية لتحليلات التيار؟ وما هو القاسم المشترك بين تلك الصناعات؟ 

-١‏ بالمقارنة مع التحليلات العاديةء هل تعتقد أن تحليلات التيار ستحتوي على حالات استخدام 

أكثر (أو أقل) في عصر تحليلات البيانات الضخمة؟ وماذا؟ 


تمارين - شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 

-١‏ اذهب إلى teradatauniversitynetwork.com‏ وابحث عن دراسات الحالة. قم بقراءة 
الحالات والأوراق البيضاء التى تتحدث عن تحليلات البيانات الضخمة. ما هى الفكرة الرئيسة 
المشتركة بين دراسات الحالة تلك؟ 1 

-Y‏ في «teradatauniversitynetwork.com‏ قم بإيجاد الأوراق البيضاء ل تحليلات SAS‏ المرئية 
ودراسات الحالةء والتدريبات اليدوية. قم بإجراء تمارين التحليلات المرئية على مجموعات 
البيانات الضخمة ثم قم بإعداد تقرير لمناقشة النتائج التي توصلت إليها. 

-Y‏ في teradatauniversitynetwork.com‏ اذهب إلى صفحة Sports Analytics‏ قم بإيجاد 
تطبيقات البيانات الضخمة في الرياضة. لخص النتائج التي حصلت عليها. 

€- اذهب إلى teradatauniversitynetwork.com‏ وابحث عن مقاطع فيديو 851 التي تتكلم 
عن البيانات الضخمة. راجع هذه المقاطع» ثم أجب عن أسئلة الحالة المتعلقة بها. 
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مفاهيم وأدوات البيانات الضخمة 


0- اذهب إلى موقعي asterdata.coms teradata.com‏ أو أحدهما. قم بإيجاد على الأقل ثلاث دراسات 
حالة عملاء على البيانات الضخمة» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
1 اذهب إلى .IBM.com‏ قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على البيانات الضخمة 
واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-V‏ اذهب إلى .daudera.com‏ قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-A‏ اذهب إلى .mapr.com‏ قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ هادوب» 
واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
3- اذهب إلى -hortonworks.com‏ قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-٠‏ اذهب إلى marklogic.com‏ قم بإيجاد على BY‏ ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-M‏ اذهب إلى youtube.com‏ ابحث عن مقاطع فيديو عن حوسبة البيانات الضخمة. شاهد 
اثنين منهم على الأقل. لخُص النتائج التي حصلت عليها. 
-VY‏ اذهب إلى google.com/scholar‏ وابحث عن مقالات عن تحليلات التيار. قم بقراءة ثلاث 
مقالات منها على الأقل. لخّص النتائج الخاصة بك. 
-Y*‏ ادخل على qoogle.com/scholar‏ وابحث عن مقالات عن التنقيب في تيار البيانات. قم 
بقراءة ثلاث مقالات منها على الأقل. gabd‏ النتائج الخاصة بك. 
-٤‏ ادخل على «oogle.com/scholar‏ وابحث عن مقالات تتكلم عن البيانات الضخمة في مقابل 
مستودعات البيانات. قم بقراءة خمس مقالات منها على الأقل. لخّص النتائج الخاصة بك. 
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الفصل الثامن 
الاتجاهات المستقبلية والخصوصية 
والاعتبارات الإدارية في التحليلات 


أهداف التعلم: 
- استكشاف بعض التقنيات حديثة الظهور التي قد توثر على التحليلات» وذكاء الأعمالء ودعم القرار. 
- وصف الظاهرة حديثة الظهور ال معروفة باسم إنترنت الأشياء (IoT)‏ والتطبيقات المحتملة, 
والنظام الاقتصادي لظاهرة (إنترنت الأشياء). 

- وصف الاستخدام الجاري والمستقبلي للحوسبة السحابية في تحليلات الأعمال. 
- وصف كيفية مساعدة التحليلات المبنية على الجغرافية المكانية واموقع للمنظمات. 
- وصف التأثيرات التنظيمية لتطبيقات التحليلات. 
- سرد ووصف القضايا الأخلاقية والقانونية الرئيسة لتنفيذ التحليلات. 
- تحديد الخصائص الرئيسة لمحترفي ele‏ البيانات الناجح. 

يقدم هذا الفصل عدة تقنيات حديثة الظهور والتي من المحتمل أن تكون ذات تأثيرات جوهرية 
على تطوير واستخدام تطبيقات ذكاء الأعمال. وفي مجال حرق كالتحليلات» فإن المصطلحات أيضًا 
تتطور وتتداخل. وكما سبق ذكره فيمكننا الرجوع إلى هذه التقنيات مثل ذكاء الأعمال أو 
التحليلات» أو علم البيانات» أو تعلم الآلةء أو الذكاء الاصطناعي (AD‏ أو الحوس بة المعرفية» أو 
البيانات الضخمة: أو العديد من العناوين الأخرى. وليس هدفنا هو التركيز على الفروق الطفيفة 
بين كل منهاء ولكن الهدف هوالتعامل معهم جميعًا ككوكبة كبيرة واحدة. إننا نركز على بعض 
الاتجاهات التي تحققت بالفعل وعاى البعض الآخر المتوقع أن يؤثر بصورة أكبر على التحليلات. 
ودائمًا ما يعد استخدام كرة كريس تال اقتراحًا منذرًا بالخطرء ولكن في هذا الفصل نقدم تحليلًا 
لبعض المجالات النامية. كما نقدم ونشرح بعض التقنيات حديثة الظهور وكذلك نستكشف بعض 
تطبيقاتها المعاصرة. ثم نناقش بعد ذلك التأثيرات التنظيمية والشخصية والقانونية والأخلاقية 
والاجتماعية لأنظمة الدعم التحليلي والقضايا التي يجب أن يهتم بها مديرو ومحترفو التحليلات. 
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الفصل الثامن 


(Siemens) مقال افتتاحى: تحليل بيانات الاستشعار يساعد سيمنس‎ ١-6 
على تجنب أعطال القطارات:‎ 

تعتبر شركة Siemens‏ أكبر منتج في العام لتقنيات كفاءة الطاقة وتوفير الموارد. يقع المقر 
الرئيسي للشركة في برلين dallo‏ بعائدات IP‏ مليار دولار سنويًا. تنتج Siemens‏ قطارات متنوعة 
ومكونات بنية تحتية تشبه أنظمة التحكم وأنظمة الطاقة. 

يعتقد فريق خدمات نقل البيانات التابع لشركة Siemens‏ أن تحليلات البيانات الضخمة 
وإنترنت الأشياء (IOT)‏ يستطيع أن يمكنهم من توقع أخطاء المكونات لأسابيع قادمة. إنهم 
يستكش فون هذه الأساليب للتأكد من عدم ترك أي قطار محجوز على المسارات بسبب أعطال 
فنية غير متوقعة. وتريد Siemens‏ الانتقال من الصيانة التفاعلية (بعد الحادث) والصيانة 
الوقائية (بعمليات التفتيش المنتظمة) إلى الصيانة التنبؤية للقطارات. 

تقيس أجهزة الاستشعار المتصلة مكونات قطاراتها ا موقف الحالي للمكونات» حيث تقوم شركة 
Siemens‏ بجمع وتحليل بيانات جهاز الاستشعار بشكل فوري تقريبًا. وإذا تم العثور على أي شذوذ 
في البيانات» فهذا يشير إلى احتمال عطل أحد المكونات. وبالتالي» هكن اتخاذ تدابير وقائية 3 لذلك. 

وفقًا لمدونة تيراداتاء يعتمد مهند سو Siemens‏ على بيانات عشرات الآلاف من أجهزة الاستشعار. 
تذهب كل من بيانات القطارات والسكك الحديدية» وبيانات عمليات الإصلاح» وبيانات الطقس» 
وبيانات سلاسل التوريد. إلى بنية البيانات الموحدة تيراداتا التابعة لشركة Siemens‏ للاستفادة من 
Teradata Asterg Hadoop‏ ومستودع بيانات تيراداتا. وصرح Gerhard Kress‏ مدير فريق 
خدمات نقل البيانات بشركة ÜE Siemens‏ « لا يمكننا أن نفعل ما نفعله tlo‏ على بنية مختلفة 
لأن أحجام البيانات لدينا كبيرة جدًا. ولذا؛ فمثلًا بالنسبة لأسطول سيارات من أوروباء قمنا بجمع 
كل بيانات أجهزة ol aca‏ وكانت حوالي ٠٠١‏ مليار سطرًا جدوليًا. وإذا كنت ترغب في تنفيذ 
خوارزمية تعلم الآلة على ذلك فهي لا تعمل على شيء ليس موازياً بشكل كبير». 

يسمح تعلم الآلة باستخدام بيانات جهاز الاستشعار لعلماء ومهندمي البيانات بشركة 
Siemens‏ من الكشف السريع عن الإيجابيات الخاطئة (التنبؤ بعطل Y‏ يحدث فعلًا) وإعطاء 
تنبؤ واضح بأعطال الجزء الفعلي. ولأن الإنذارات الكاذبة تكون CST‏ من الإنذارات الحقيقية 
تقوم المنظمة بالنظر في أوامر «Jas!‏ والأرقام التسلسلية» وتاريخ بيانات القطارات والخدمات» 
ومعلومات التشخيص. وبيانات جهاز الاستشعارء وعمليات الإصلاح» وبيانات سلاسل التوريد 
للمساعدة في تحديد وحل أعطال الجزء الحقيقي. وتستطيع 5 أن تحدد بدقة أيهما 
أكثر عرضة dhat‏ هل هو القطار فائق السرعة بين موس كو وسانت بتسبرج في الشتاء القارس 
أم القطار فائق السرعة في إسبانيا الحارة في أيام ainal‏ وذلك عن طريق دمج Olly‏ الطقس. 
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الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


يستخدم مشغل القطار الأسباني RENFE‏ المكونات الأساسية لقطار Jle Siemens‏ السرعة 
Valero E‏ الخاضع للمراقبة المستمرة من جانب Siemens‏ فإذا كانت أنماط بيانات جهاز الاستشعار 
التي تم جمعها غير طبيعية» يتم إرسال فريق للتحقق من هذه المكونات» وبالتالي Jhe gig‏ القطار 
على المسارات. وكنتيجة لذلكء لم يتأخر بشكل ملحوظ سوى قطار واحد فقط من أصل ۲۳۰۰ قطار. 
وتزعم Lai Siemens‏ أن المصداقية المرتفعة لقطاراتها قد ساعدت الكثير من مشغلي القطارات على 
تحسين أدائهم فيما يتعلق بالوقت المناسب. فعلى سبيل «JUL‏ تعمل قطارات بانكوك بنسبة تأخير 
١‏ فقط. وتقدّر Siemens‏ كذلك أن التشغيلات التى هكن الاعتماد عليها بشكل كبير بين برشلونة 
ومدريد قد أدت إلى زيادة معنوية في عدد ركاب القطارات وتقليص حركة الملاحة الجوية. 

وهكذاء تكون النمذجة التنبؤية قد منحت Siemens‏ فرصة خدمية جديدة. لقد تم تأسيسها 
الآن كمورد رئيس لخدمة تتبع أعطال القطارات. وسيصبح بيع هذه الخدمات التنبؤية أكثر 
أهمية من مجرد المعدات الأصلية. 


ما هى الدروس التى يمكننا تعلمها من هذه المقالة الافتتاحية؟ 
تقود Siemens‏ تطوير الخدمات الإضافية والقيمة للمنتجات الصناعية الضخمة القادمة من 
الصناعات الكبيرة نسبيًا؛ إذ هكن للشركة إنشاء صورة أفضل لطريقة أداء منتجاتها على أرض الواقع» 
وذلك من خلال استعمال أجهزة الاستشعار التي تولد كميات كبيرة ومتنوعة من البيانات ودمج تلك 
البيانات مع مصادر البيانات الأخرى مثل الطقس. وعلاوةً على ذلك فإن تحليل مثل هذه البيانات 
قد يساعد العميل على أداء الصيانة فقط عندما يلزم ذلك وليس وفقًا لجدول زمني. ولقد أصبح بيع 
Jia‏ هذه الخدمات التحليلية محور اهتمام أساسي جديد بالنسبة لجميع المنتجين JE‏ 285 للمعدات 
الصناعية مثل General Electrics Siemens‏ كما يعتبر بيع خدمات أداء التحليلات على المنتجات 
والصيانة التنبؤية أو الإصلاحات laa Vis‏ لإنشاء فرص تسويقية جديدة للمنتجات القائمة. 
أسئلة للمناقشة: 
-١‏ في مجال المعدات الصناعية مثل القطارات» ما هي OLEI‏ التي يمكن قياسها بانتظام لتقدير 
الأداء الحالي للمعدات والإصلاحات اللازمة مستقبلا؟ 
-Y‏ كيف هكن أن نستفيد من بيانات الطقس في تحليل حالة معدات القطارات؟ 
-Y‏ قدّر كمية البيانات التي تحتاج لجمعها في شهر واحد باستخدام متلا ٠٠٠١‏ جهاز استشعار على 
قطار واحد. ob Gle‏ كل جهاز استشعار يعطي Y‏ كيلوبايت من البيانات في الثانية الواحدة. 
-٤‏ ما هو تصورك لتخزين مثل هذه المجموعات من البيانات؟ 
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۸ إنترنت الأشياء: 

قدمت JULI‏ الافتتاحية مجالًا يواجه نموًا كبيرا في الوقت الراهن. يعتبر إنترنت الأشياء (oT)‏ 
ظاهرة لربط العام المادي بالإنترنت» بخلاف إنترنت الأشخاص الذي يربط البشر ببعضهم البعض 
من خلال التقنية. ففي إنترنت الأشياءء تتصل الأجهزة المادية بأجهزة الاستشعار التي تجمع بيانات 
عن الجهاز مثل التشغيل والموقع والحالة الراهنة. تتم معالجة هذه البيانات باستخدام أساليب 
تحليلية متنوعة بلراقبة الجهاز عن بُعد من مكتب مركزي أو للتنبؤ بأي أخطاء قد تحدث للجهاز. 
ولعل المثال الأشهر على إنترنت الأشياء هو السيارة ذاتية القيادة. ولي تقود نفسها بنفسهاء تحتاج 
السيارة وجود أجهزة استشعار كافية لمراقبة الموقف تلقائيًًا من حولها وتتخذ الإجراءات AULI‏ 
لضبط أي إعداد لازم» Le‏ في ذلك سرعة السيارة واتجاهها وما إلى ذلك. ومن الأمثلة الشائعة الأخرى 
على إنترنت الأشياء هو جهاز متتبع اللياقة الذي يسمح للمستخدم بتتبع أنشطته الجسدية كالمشي 
والجري والنوم. axis‏ شركة Smartbin‏ مثالا آخر لتوضيح ظاهرة إنترنت الأشياء. فقد قامت 
Smartbin‏ بتطوير حاويات القمامة ذات أجهزة استشعار للكشف عن مستويات الامتلاء؛ حيث 
يقوم جهاز الاستشعار بإخطار شركة جمع القمامة تلقائيًا ob‏ الحاويات قد امتلأت تقريبًا وتحتاج 
للتفريغ. وبالطبع» يعد JULI‏ الأكثر شيوعًا الذي يضربه الناس لتوضيح إنترنت الأشياء هو فكرة 
طلب الثلاجة للحليب تلقائيًا عندما تكتشف أن الحليب قد نفد. وقدمت شركة كلوروكس فلتر 
8 الجديد المزود بوعاء به Wi-Fi‏ يستطيع طلب فلاتر ol]‏ بنفسه عند اكتشاف وقت التغيير. 
في كل هذه الأمثلة, لا يضطر البشر إلى التواصل مع بعضهم البعضء ولا حتى مع أي آلة في كثير 
من الحالات؛ حيث تستطيع الآلات أن تتكلم. وهذا هو سبب استخدام مصطلح إنترنت الأشياء. 

55( لبحث (Y « 1) Juniper‏ فبالإضافة إلى أجهزة التابلت والهواتف الذكية والحواسيب 
الشخصيةء سيتم ربط أكثر من YA‏ مليار شيء بالإنترنت وذلك بحلول عام .Y Y»‏ وفيما يلي بعض 
الأسباب للنمو الكبير في إنترنت الأشياء: 
-١‏ كون الأجهزة أصغر حجمًا وأرخص Eaa‏ وأكار قوة: لقد انخفضت تكاليف c‏ وأجهرة الاستشعار 

بشكل كبير في العشر سنوات المنصرمة» مما أدى بشكل عام لإنتاج جهاز استشعار أرخص كثيرا. 


-Y‏ إمكانية التنقل الرخيصة: وقد انخفضت كذلك تكاليف معالجة البيانات والسعة التنزيلية 
وأجهزة الجوال بنسبة ZAY‏ منذ العقد الماضي. 


Source: Adapted from teradata.com (2016). The Internet of trains. http:// www.teradata.com/resources/ 
case-studies (accessed August 2016); theit.org. (2016). Siemens tracks Big Data for trains that keep on 
running. http:// eandt.theiet.org/magazine/2016/07/siemens-Big-data-trains.cfm (accessed August 2016); 
Siemens.com (2016). About Siemens. http:// www.siemens.com/about/en/(accessed August 2016). 
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-Y‏ توافر أدوات ذكاء الأعمال: تعرض الآن الكثير والكثير من الشركات أدوات ذكاء الأعمال الخاصة 
بها سواء على أجهزتها أو على السحابة بمعدلات أقل. وتكون أدوات البيانات الضخمة وذكاء 
الأعمال متاحة على نطاق واسع وبصورة متطورة للغاية. 

-E‏ تظهر يوميًا بشكل افتراضي حالات استخدام جديدة ومثيرة. 


كما ينبغي علينا ملاحظة وجود بعض التعارض حول استخدام مصطلح إنترنت الأشياء. وأيضًا 
يطلق عليه البعض مصطلح ويب الأشياء Web of Things‏ ويسميه البعض الآخر إنترنت الأنظمة 
لأنه في العديد من الطرق سيكون هناك توليفة من الأنظمة التي تتواصل فيما بينها. عمومًاء سنشير 
في هذا الفصل لهذه الظاهرة باسم إنترنت الأشياء (101) لتحقيق الاتساق. 
وتختلف التقديرات على نطاق واسع فيما يخص نمو صناعة إنترنت الأشياء في حين سيتم 
إنفاق مبلغ يتراوح ما بين تريليون ١١9‏ تريليون دولار تقريبًا على حلول إنترنت الأشياء بقدوم 
عام Y Y‏ والتي تعد واحدة من g ul‏ قطاعات تقنية المعلومات Id‏ بشكل عام وعنصرًا أساسبًا 
في صناعة التحليلات. وتعطي الحالتان العمليتان (۱-۸) و(۲-۸) مثالين لتطبيقات إنترنت الأشياء 
في صناعات مختلفة باستخدام منصتين تقنيتين مختلفتين. 
حالة عملية ١-8‏ 
شركة زوارق SilverHook‏ تستخدم تحليل البيانات الفوري 
لإخطار المتسابقين وا مشجعين 
تعتبر زوارق SilverHook‏ إحدى أسرع القوارب في العام والأكفأ في استهلاك الطاقة 
والتي تصنعها شركة تحمل نفس الاسم. وتستخدم زوارق SilverHook‏ في جميع 
سباقات الزوارق حول bll‏ تواجه القوارب المنطلقة بسرعات dle‏ ضد المياه المالحة 
hò‏ عطل المعدات. ويعتمد المتسابقون على بيانات القياس عن بُعد من قواربهم 
لاتخاذ قرارات تتعلق بالسلامة والتخطيط. وفي بعض المواقفء يتم gaz Ll‏ بيانات 
القياس الحيوية للمتسابقين. وبالتاليء يستقبل المتسابقون الكثير من المعلوماتء مما 
casual‏ تتبع كل البيانات. كما لاحظت SilverHook‏ أن جمهور سباقات الزوارق كانوا 
يواجهون صعوبة ممتابعة المتسابقين في المحيطء كلما انطلقت القوارب بسرعة. مما قلل 
من تعلق الجمهور باللعبة. وقد جمعت SilverHook‏ البيانات من ۸۰ جهاز استشعار 
ولكن لم تكن هناك طريقة سهلة للحصول على أفكار لتحسين قدرات اتخاذ القرار 
واتخاذ قرارات السلامة وتحسين تجربة الجمهور. 
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استخدم فريق SilverHook‏ منصة Jail) PaaS asas IBM Bluemix‏ القتسم 
(Jl‏ لاستخدام حلول تحليلات IBM SPSS‏ وتوصيل أفكار مفهومة للمستخدمين 
والجماهير. وقد تمكنت SilverHook‏ عن طريق PaaS‏ من إنشاء تطبيقات. وسحب 
بيانات في السحابةء وإجراء التحليلات المطلوبة على تلك البيانات. واستخدم IBM‏ 
Bluemix‏ بالاشتراك مع شركة Virtual Eye‏ قاعدة إنترنت الأشياء لإرسال بيانات 
الاستشعار المتولدة من أجهزة الاستشعار ونظام تحديد المواقع العالمي (GPS)‏ إلى 
السحابة. وقد تم إجراء تحليل على بيانات جهاز الاستشعار باستخدام أدوات التحليل 
الموجودة في .IBM Bluemix‏ كما قامت Virtual Eye‏ بتوصيل تنبيهات المعلومات 
الفنية للفريق المتسابق والتمثيل الفوري للسباق إلى الجماهير. والآن يستطيع 
المتسابقون الحصول على رؤية فورية عن السباق» لتحسين قراراتهم وقدرتهم التنافسية. 

-١‏ ما هو نوع المعلومات المهمة للمتسابقين والتي يمكن أن تنشئها أجهزة الاستشعار 
على قارب السباق؟ وماذا عن الجماهير؟ 

-Y‏ ما هى الرياضات الأخرى التى يمكن أن تستفيد من تقنيات مشابهة؟ 

-Y‏ ما هي التحديات التقنية التي يمكن أن تواجهها في إنشاء Jio‏ هذه الأنظمة؟ 
Sources: IBMBigdatahub.com. (2015). SilverHook Powerboats: Tracking fast-moving‏ 
boats in real time. http://www.ibmBigda-tahub.com/blog/silverhook-powerboats-tracking-‏ 
fast-moving-powerboats-real-time (accessed August 2016); IBM.com (2015). Case study:‏ 
SilverHook Powerboats. http://www.ibm.com/cloud-computing/case studies/silverhook-‏ 


powerboats.html (accessed August 2016).‏ 
حالة عملية Y-A‏ 
شركة Rockwell Automation‏ تراقب أصول استكشاف النفط والغاز غالية الثمن 

تعتبر شركة Rockwell Automation‏ إحدى أكبر شركات توريد حلول التشغيل الآلي 
الصناعي والمعلومات الصناعية في العاط؛ إذ ينتشر عملاؤها في أكثر من 6١‏ دولة حول 
العام ويعمل بها حوالي 776٠٠‏ موظف. وترتكز الشركة في عملها على عدة مجالات» يعد 
أحدها مساعدة شركات النفط والغاز في الامتكشاف. ومن أمثلة ذلك شركة Hilcorp‏ 
Energy‏ وهي شركة تقوم بالتنقيب عن النفط في ألاسكاء وهي تستخدم معدات غالية 
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الثمن جدًا في الحفر والاستخراج وتكرير النفطء ويمكن لعطل واحد في المعدات أن يكلف 
شركة النفط والغاز فاقد إنتاج ها يتراوح من ٠٠١‏ ألف إلى ٠١‏ ألف دولار في اليوم. 
ويتطلب التعامل مع هذه المشكلة وجود تقنية يمكنها مراقبة حالة مثل هذه المعدات عن 
بُعدء كما يمكنها التنبؤ با مشكلات التي من المحتمل أن تحدث بشكل جيد في وقت مبكر. 
اقتنصت Rockwell Automation‏ هذه الفرصة لتوسيع أعمالها في صناعات النفط 
والغاز من خلال جمع البيانات من مواقع الاستكشاف وتحليلها لتحسين الكفاءة وقيادة 
الأداء بشكل أفضل. وتحصل الشركة على رؤيتها من Connected Enterprise‏ باستخدام 
إنترنت الأشياء التابعة لمايكروسوفت (Microsoft)‏ لتوفير مراقبة ودعم معدات النفط 
والغاز التي تحتل مكانًا في مناطق بعيدة. وتوفر Rockwell Automation‏ الآن حلولًا 
للتنبؤ الفوري بأعطال المعدات على طول سلاسل توريد البترول» ومراقبة صحتها وأدائهاء 
والمساعدة في منع عطلها في المستقبل. وتتركز هذه الحلول في المجالات التالية: 

-١‏ الحفر: تمتلك شركة Hilcorp Energy‏ معدات الضخ الخاصة بها المتمركزة 
في ألاسكاء حيث تقوم بالتنقيب عن النفط Ye‏ ساعة في اليوم» ويمكن Jhal‏ واحد في 
المعدات أن يكلف الشركة الكثير من المال. وقامت Ja Rockwell Automation‏ 
المشغلات الكهربائية المتغيرة لمعدات الضخ بالسحابة (انظر القسم (YU‏ بحيث يمكن 
التحكم في هذه الآلات على بعد آلاف الأميال من غرفة التحكم في أوهايو؛ إذ تقوم 
أجهزة الاستشعار بالتقاط البيانات» وتمريرها إلى Microsoft Azure Cloud‏ عن طريق 
بوابة التحكم الخاصة بشركة Rockwell‏ ثم تصل هذه البيانات إلى المهندسين التابعين 
ل Hilcorp Energy‏ من خلال لوحات معلومات رقمية» فتقوم لوحات المعلومات هذه 
بعرض معلومات عن الضغط ودرجة الحرارة ومعدل التدفق وعشرات اللَعْلّمات الأخرى 
بشكل آني مما يساعد المهندسين على مراقبة صحة وأداء المعدات. كما تعرض لوحات 
المعلومات هذه تنبيهات عن أي مشكلات محتملة. فعندما تعطلت إحدى قطع معدات 
الضخ الخاصة بشركة Hilcorp‏ تم تحديد العطل وتعقبه وإصلاحه في أقل من ساعة 
مما أدى لتوفير T‏ ساعات من تعقب العطل والتكلفة الناجمة عن فاقد الإنتاج. 

-Y‏ بناء مضخات غاز أذى: في هذه الأيامء تقوم بعض شاحنات النقل باستخدام الغاز 
الطبيعي السائل كوقود. وتقوم شركات النفط بتحديث محطات تعبئة الوقود الخاصة بها 
لدمج مضخات الغاز الطبيعي السائل. كما قامت شركة Rockwell Automation‏ بتثبيت 
أجهزة استشعار ومشغلات تردد متغير على هذه الشاحنات لجمع بيانات فورية عن 
تشغيل المعدات ومخزون الوقود ومعدل الاستهلاك. وتتم إحالة هذه البيانات إلى منصة 
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السحابة الخاصة بشركة Rockwell‏ والتي تقوم بدورها بإنشاء لوحات معلومات تفاعلية 
وإعداد تقارير لوصف هذه التفاصيل Microsoft Azure elus Lob‏ ومن ثم إرسالها إلى 
المستفيدين U‏ مما يعطي انطباعًا Boya‏ للمستفيدين عن سلامة أصول رأسمالهم. 

Az!‏ عملت حلول Connected Enterprise‏ المقدمة من شركة Rockwell‏ على 
زيادة سرعة نمو العديد من شركات النفط والغاز مثل شركة Hilcorp Energy‏ من 
خلال وضع بيانات العمليات الخاصة بها على منصة السحابة ومساعدتها على تقليل 
التكلفة الناجمة عن أوقات الأعطال والصيانة. ونتج عن هذا ظهور فرص عمل جديدة 
للمصنعين الشجعان مثل .Rockwell Automation‏ 


أسئلة للمناقشة: 
-١‏ ما هو نوع المعلومات التي من المرجح أن يتم جمعها من J‏ منصة التنقيب 
عن النفط والغاز؟ 


-Y‏ هل يتناسب هذا التطبيق مع الثلاث V's‏ (الحجم والتنوع والسرعة) الخاصة 
بالبيانات الضخمة؟ SU‏ نعم أو اذا لا؟ 

-Y‏ ما هي الصناعات الأخرى التي يمكنها استخدام مقاييس تشغيلية ولوحات 
معلومات مشابهة؟ 
Sources: Customers.microsoft.com. (2015). Rockwell Automation: Fueling the oil‏ 
and gas industry with IOT. https;//customers.microsoft.com/Pages/CustomerStory.‏ 


aspx?recid-19922 (accessed August 2016); Microsoft.com. (n.d.). Customer stories| 
Rockwell Automation. https;//www.microsoft.com/en-us/cloud-platform/cus- tomer- 


stories-rockwell-automation (accessed July 2016). 

البنية التحتية لتقنية إنترنت الأشياء: 
من نظرة بعين الطائرء يمكن تقسيم تقنية إنترنت الأشياء إلى أربع مجموعات رئيسة والموضحة 

في الشكل (1-8) كما يلي: 

-١‏ الأجهزة :(Hardware)‏ وتشمل الأجهزة ALI‏ وأجهزة الاستشعارء والمشغلات الميكانيكة 
التي يتم فيها إنتاج وتسجيل البيانات. والأجهزة هي المعدات التي تحتاج إلى التحكم فيها أو 
مراقبتها أو تتبعها. وقد تحتوي أجهزة الاستشعار الخاصة بتقنية إنترنت الأشياء على معالج 
أو أي جهاز حوسبة والذي يقوم بتوزيع البيانات الواردة. 
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-Y‏ الاتصال (Connectivity)‏ ينبغي أن يكون هناك محطة أساسية أو مركز رئيس يقوم بجمع 
البيانات من القطع المزودة بأجهزة الاستشعار وإرسال تلك البيانات إلى السحابة. يتم ربط 
الأجهزة بشبكة لتتواصل مع بعضها البعض أو مع تطبيقات أخرىء وقد يكون هذا الربط 
مباشر أو غير مباشر بالإنترنت. وتعمل البوابة على تمكين الأجهزة غير المتصلة مباشرةً بالإنترنت 
من الوصول إلى منصة السحابة. 

-Y‏ الخلفية البرمجية :(Software backend)‏ وفي هذه الطبقةء تتم إدارة البيانات التي تم 

t‏ حيث تقو تقوم الخلفية البرمجية بإدارة الشبكات والأجهزة وتوفير تكامل البيانات. وقد 
يكون هذا جيدًا Mr‏ في السحابة (انظر القسم التالي ثانية). 

-٤‏ التطبيقات: وفي هذا الجزء من إنترنت الأشياءء يتم تحويل البيانات إلى معلومات ذات معنى. 
وقد يتم تشغيل العديد من التطبيقات على الهواتف الذكية وأجهزة التابلت وأجهزة الحاسب 
الشخصي وتقوم بعمل شي مفيد مع البيانات. كما يتم تشغيل تطبيقات أخرى على الخادم 
ومن ثم تقديم نتائج أو تنبيهات من خلال لوحات المعلومات أو الرسائل إلى المختصين. 
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أجهزة استشعار التعريف بترددات الراديو RFID‏ 


تعتبر تقنية التعريف بترددات (RFID) AJI‏ واحدة من أقدم تقنيات الاستشعار الموجودة 
والتي تشهد موا Bus‏ وتعتبر RFID‏ تقنية شاملة تشير إلى استخدام موجات تردد الراديو 
لتحديد الأهداف. وبشكل أساسيء تعد هذه التقنية مثالا لعائلة تقنيات تحديد الهوية DA‏ 
والتي تشمل Lal‏ الباركود والقضبان المغناطيسية واسعة الانتشارء حيث استخدمت سلاسل 
توريد التجزئة (والعديد من المجالات الأخرى) منذ منتصف السبعينيات تقنية الباركود كشكل 
أسامي لتحديد الهوية تلقائيًا. وقد روجت مزایا RFID‏ المحتملة لانتهاج هذه التقنية بقوة إلى 
العديد من الشركات (بقيادة كبرى شركات (Dillard'ss .Targets Wal-Mart Jia 4552cJ‏ 
كطريقة لتحسين سلاسل التوريد الخاصة بهم وبالتالي تقليل التكاليف وزيادة المبيعات. 

كيف تعمل تقنية RFID‏ في أبسط صورة A‏ يتكون نظام RFID‏ من علامة (متصلة بالمنتج المراد 
التعرف عليه)» وأداة استجواب (بمعنى قارئ) وهواني واحد أو أكثر متصلين بالقارئ» وجهاز حاسب 
(للتحكم في القارئ والتقاط البيانات). Llog‏ بدأت سلاسل التوريد في الاهتمام أكثر باستخدام 
علامات RFID‏ غير المباشرة؛ إذ تستقبل العلامات غير المباشرة الطاقة من ا مجال الكهرومغناطيسي 
الذي أنشأته أداة الاستجواب (وليكن القارئ) وا معلومات المرتدة فقط عندما يتم طلبها. وتظل 
العلامة غير المباشرة نشطة فقط عندما تكون داخل المجال المغناطيسي لأداة الاستجواب. 

ds‏ المقابلء يكون لدى العلامات المباشرة بطارية على لوح مسطح لتنشيطها. وحيث إن لدى 
العلامات المباشرة مصدر طاقة خاضًا بها فهي لا تحتاج قارنًا لتنشيطها؛ بل يمكنها الشروع في عملية 
نقل البيانات من تلقاء نفسها. وبالمقارنة مع العلامات غير المباشرة, فإن للعلامات المباشرة نطاق 
قراءة أطول ودقة أفضل وتخزين معلومات أكثر تعقيدًا قابا لإعادة ALSI‏ وقدرات معالجة أكثر 
ثراءً )2005 .(Moradpour & Bhuptani,‏ ولكن نظرًا لوجود البطاريةء يكون للعلامات المباشرة 
بعض السلبيات» ومنها أن فترة حياتها تكون أقصرء وحجمها cs S]‏ وثمنها أغلى من العلامات غير 
المباشرة. lors‏ يتم تصميم وتشغيل معظم تطبيقات بيع التجزئة بعلامات سلبية. وغالبًا ما 
يتكرر وجود العلامات المباشرة في أنظمة الدفاع أو العسكريةء ولكنها تظهر كذلك في تقنيات مثل 
EZ Pass‏ حيث ترتبط العلامات بحساب مدفوع da‏ مما SS‏ السائقين من دفع الرسوم أثناء 
القيادة فقط با مرور على القارئ as‏ من التوقف للسداد عند كشك تحصيل الرسوم. 

يعد تمثيل البيانات الأكثر انتشارًا بالنسبة لتقنية RFID‏ هو رمز المنتج الإلكتروني LEPC)‏ 
والذي ينظر إليه العديد من العاملين في الصناعة على أنه الجيل التالي من رمز المنتج العالمي 
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EPC يتكون‎ UPC والذي يتم تمثيله في الغالب ہا يسمى باركود. وكما هوالحال في‎ (UPC) 
من سلسلة من الأرقام التي تحدد أنواع المنتجات والمصنعين عبر سلاسل التوريد. كما يتضمن رمز‎ 
مجموعة إضافية من الأرقام لتحديد العناصر بشكل فريد.‎ EPC 

وف الوقت الحاليء تحتوي معظم علامات RFID‏ على 51 cub‏ من البيانات في شكل أرقام 
تعريف التجارة العالمية المسلسلة (SGTINS)‏ لتحديد حالات أو رموز حاوية الشحن المسلسلة 
لتحديد لوحات التنزيل ule)‏ الرغم من إمكانية استخدام Lá] SGTINS‏ لتحديد لوحات التنزيل). 
ويمكن إيجاد الدليل الكامل لوضع علامة معايير البيانات على موقع الويب الخاص بشركة 
.(epcglobalinc.org) s »5 EPCglobal‏ وتعتبر شركة EPCglobal‏ منظمة يشترك في قيادتها 
رواد الصناعة والمنظمات التي تركز على إنشاء معايير عاطية ل EPC‏ لدعم استخدام RFID‏ 


وكما هو موضح في الشكل (Y-A)‏ تظهر بيانات العلامات في أنقى صورها عبارة عن سلسلة من 
الأرقام SUI‏ والتي يمكن تحويلها بعد ذلك إلى المعادل العشري 56:1121. وكما يتضح يعتبر 
SGTIN‏ بشكل أساسي UCC-14) UPC‏ لتحديد حاوية الشحن) برقم مسلسل. ويعتبر الرقم 
المسلسل هو eal‏ فرق بين كل من ال UPC‏ المكون من G3 VE‏ المستخدم اليوم وبين SGTIN‏ الذي 
يتضمن علامة UPCs gad RFID‏ يمكن للشركات تحديد عائلة المنتج التي تنتمي إليها الحالة (مثل» 
مناديل كارمن ۸ - عبوات)» ولكن لا هكن تمييز عبوة واحدة من أخرى. أما مع SGTIN‏ فيتم تحديد 
كل قطعة بشكل فريدء وهذا يوفر مستوى رؤية على مستوى القطعةء بدلا من مستوى عائلة qu‏ 
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الرقم المسلسل < المنتج ١‏ الصانع 


فحص الرقم a RS CREER CREER‏ عشري 
(ئيس مطلوبا ل (RFID‏ كك .341813 . 0023800 Sõrm)‏ 
(UPN) 3 0023800 41813 3‏ 





شكل :Y-A‏ علامة RFID Olly‏ 
ويعد أحد تطبيقات الكميات الضخمة من البيانات المتولدة عن طريق RFID‏ في إدارة سلاسل 
التوريد )2007 .(Delen, Hardgrave, & Sharda,‏ كما تستطيع الشركات استخدام RFID‏ لتحسين 
كفاءة أو فعالية العمليات الحالية المتنوعة عن طريق التغيير التدريجى للعملية. فعلى سبيل «JUL‏ 
اقترحت الأدلة الأولية إمكانية تخفيض وقت استلام المنتج في المستودع باستخدام )2006 (Katz,‏ 
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RFID‏ فبدلًا من عمل مسح ضوف لكل قطعة من المنتج على انفراد باستخدام ماسح الباركودء 
هكن قراءة المنتج ذي علامة REID‏ تلقائيًا على بوابة استلام المنتجات. وقدمت شركة جيليت تقريرًا 
بانخفاض وقت استلام لوحات التنزيل في مركز التوزيع الخاص بها من ٠١‏ ثانية إلى 0 ثوان بفضل 
RFID‏ وإستراتيجية علامة - على - المصدر التابعة لها )2006 (Katz,‏ وم تتغير عملية الاستلام 
جذريًا (أي إن الرافعات الشوكية قامت بتفريغ المنتج كما كان من قبل). وكان التغيير الوحيد هو 
إزالة الحاجة للمسح اليدوي للمنتج. وبالتاليء أصبحت العملية أكثر كفاءة. كما يمكن زيادة فعالية 
العمليات. Aid‏ وجدت شركة Wal-Mart‏ انخفاضًا بنسبة XYY‏ في المخزون باستخدام بيانات 
RFID‏ لتوليد قوائم أفضل للمنتجات التي سيتم تجديدها(ة Hardgrave, Langford, Waller,‏ 
(Miller, 8‏ إذ لم تتغير عملية تجديد الرف» ولكن تم تحسينها باستخدام RFID‏ كما يستخدم 
RFID‏ لتقليل عدد الأخطاء مما يحسن دقة المخزونء ويؤدي في النهاية إلى تحسين التنبؤ والتجديد. 

وقد تم استخدام بيانات REID‏ في العديد من التطبيقات المرتبطة الأخرى. فعلى سبيل المثال» 
تمثل البضائع القابلة للتلف أحد التحديات الكبرى لإدارة سلسلة التوريد بسبب العدد الكبير من 
المتغيرات ذات الخصائص المختلفة القابلة للتلف. ومتطلبات حساب تدفق البضائع في بعض 
سلاسل التوريدء وكميات كبيرة من البضائع التي يتم تداولها على مسافات طويلة. وعلى الرغم 
من أن الطعام يمثل الجزء الرئيس من قائمة المنتجات القابلة للتلفء إلا أن العديد من المنتجات 
الأخرىء كالزهور الحديثة والأدوية ومستحضرات التجميل وقطع غيار السيارات» وغيرهاء تتطلب 
ضوابط بيئية صارمة للإبقاء على جودتها. ونظرًا لأن حجم البضائع اللتداولة كبير der‏ فتزداد 
احتمالية حدوث المشاكل )2007 .(Sahin, Babai, & Dallery Vaillant,‏ كما يزيد القضاء على 
نسبة صغيرة من التلف مثلًاه من معنوية التحسن في سلاسل التوريد. ولذلك' تكون للإدارة المثلى 
لسلاسل توريد البضائع القابلة للتلف أهمية كبرى للشركات في هذا القطاع السوقي. 

يعتمد نجاح سلاسل التوريد سريعة الزوال اليوم على مستوى (وتوقيت) بروز المنتج. وينبغي 
أن يجيب هذا الظهور على أسئلة «أين المنتج الخاص بي؟» و«ما هو شرط المنتج الخاص بي؟». 
وبالفعل» شرعت العديد من الشركات في تجربة استخدام RFID‏ للمواد القابلة «alU‏ مع الوضع 
في الاعتبار كلا من الأمثلة التالية: 
- قامت شركة ساموورث برذارز (Samworth Brothers)‏ للتوزيع (المملكة المتحدة؛ سندويشات 

وحلويات» إلخ) بإجراء مراقبة فورية لدرجة الحرارة في شاحناتها (20062 Swedberg,‏ 


- تقوم ستاربكس باس تخدام تتبع درجات الحرارة لمنتجات إعداد الطعام المتجهة إلى منافذ بيع 
التجزئة (Swedberg, 2006b)‏ 
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- تقوم Sysco‏ باستخدام RFID‏ لفحص شروط التنزيل دون فتح الأبواب )2005 (Collins,‏ 

ولنا في إدارة جودة المنتج مثال آخر على استخدام RFID‏ في سلاسل التوريد. فقد كشفت 
الدراسات التي تستخدم علامات REID‏ القائمة على أجهزة الاستشعار في الشاحنات المزودة 
بمبردات والمخصصة لحمل ال مواد الغذائية أن درجة الحرارة فيه ا لم تكن ثابتة كما هو مفترضء 
بل تفاوتت بشكل .(Delen, Hardgrave, & Sharda, 2011) pS‏ فقد تتغير البيئة مع انتقال 
المنتج عبر سلسلة التوريدء وهذا يؤثر على جودة وسلامة المنتج. وهنا يأ دور أجهزة الاستشعار 
البيئية التي تدعم RFID'‏ إذ توفر رؤية للظروف البيئية المتغيرة المحيطة بالمنتج كما توفر البيانات 
اللازمة لتحديد مدى تأثير تلك التغييرات على جودة أو سلامة المنتج. وبدون أجهزة استشعارء 
يمكننا الحصول على تقديرات متنوعة للظروف البيئية ولكن عند نقطة واحدة فقط دون أي رؤية 
ما بين تلك النقاط (على سبيل JUL‏ درجة الحرارة في وقت às» «Ja xl‏ وقت التسليم). وفي 
تطبيقات العينةء تختلف درجات الحرارة وفقًا لأشياء معينةء منها: 
- الموقع على لوح التنزيل (في الأعلىء في المنتصفء في الأسفل). 
- ترتيب التنزيل (أي موقع لوحات التنزيل). 
- نوع الحاوية. 
gigy-‏ 
- مواد التغليف (صندوق مموج أو بلاستيك مقوى). 

ويقترح الأثر ا ملحوظ للعديد من المتغيرات ضرورة مراقبة البيئة بشكل مستمر لتحقيق الفهم 
التام للظروف المحيطة على مستوى لوح التنزيل و / أو القطعة. وبشكل عام فإن أجهزة استشعار 
(درجة الحرارة) الممكنة بتقنية RFID‏ تعمل Vue‏ وتوفر رؤية واسعة لا يمكن الحصول عليها 
بتقديرات النقطة الواحدة للظروف التي تواجه المنتج عند مروره عبر سلاسل التوريد. والدرس 
المستفاد بشكل عام هو أن تقنية RFID‏ تولد كميات ضخمة من البيانات التي هكن تحليلها للحصول 
على أفكار عظيمة بشأن بيئة الشركةء وهذا هو الغرض الرئيس لقيام ذكاء الأعمال ودعم القرار. 
الحوسبة الضبابية: 

تعد إحدى أهم القضايا في إنترنت الأشياء هي أن البيانات التي تنتجها أجهزة الاستشعار بيانات 
ضخمة: ولكن ليست كلها مفيدة. dS]‏ ما هو القدر الواجب رفعه من البيانات الضخمة على 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 140 


الفصل الثامن 


الخوادم السحابية لتحليلها؟ وتعتبر فكرة الحوسبة الضبابية هي المفهوم الجديد لحل هذا السؤال؛ 
حيث يقوم الضباب بتمديد السحابة لتكون أقرب إلى الآشياء التي تنتج وتعمل على بيانات إنترنت 
الأشياء. ويمكن وضع هذه الأجهزة والتي يطلق عليها عقد الضباب» في أي مكان بين ربط الشبكة. 
ويمكن لأي جهاز يتوفر له الحوسبة والتخزين والاتصال بالشبكة أن يكون عقدة ضباب» كأجهزة 
الراوتر أو المحولات. وفيما يلي توضيح لذلك: 

مركز البيانات / السحابة > جهاز الضباب > جهاز مادي / أجهزة استشعار لتوليد البيانات 

يؤدي تحليل البيانات بالقرب من الأجهزة إلى تقليل وقت الاستجابة. كما يحافظ Lá‏ على 
السعة التنزيلية» إذ إن إرسال البيانات إلى السحابة يتطلب سعة تحميلية كبيرة. وتزداد أهمية 
الحوسبة الضبابية عندما تحتاج البيانات للتحليل في أقل من Ayb‏ كما هو الحال في حالة Jhs‏ 
النظام المتتالي. ويعرض الجدول (V-A)‏ فرقين بسيطين بين السحابة والضباب. 


جدول 1-8: الفرق بين عقد الضباب ومنصة السحاب 








عقد الضباب منصة السحابة 
تستقبل البيانات من أجهزة إنترنت الأشياء. تستقبل وتجمع البيانات من عقد الضباب. 





تقوم بتنفيذ تحليلات إنترنت الأشياء في وقت | يتم إجراء التحليل على كميات ضخمة من بيانات 
الاستجابة باطللي ثانية. الأعمال والذي قد يستغرق ساعات أو أسابيع. 














كما قد تعطي الحوسبة الضبابية مزيدًا من الأمانء حيث يمكن تأمين عقد الضباب باستخدام 
نفس حل الأمان المستخدم في بيئات تقنية ا معلومات الأخرى. 
منصات إنترنت الأشياء: 

ولأن إنترنت الأشياء لا يزال قيد التطوير, فإن العديد من منصات التقنية الخاصة بالمجال والتطبيقات 
تتطور L‏ وليست مفاجأة أن يكون العديد من الموردين الأساسيين لأنظمة إنترنت الأشياء هم نفس 
الموردين الذين يوفرون خدمات تحليل ومستودعات البيانات لمجالات التطبيق الأخرى» والتي منها: 
-Amazon AWS IoT -‏ 
Microsoft Azure IoT Suite -‏ 
-Predix IoT Platform by General Electric (GE) -‏ 
- حلول BM Watson IoT‏ 
-Teradata Unified Data Architecture -‏ 
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وقد عرضنا مثالا على ذلك في المقالة الافتتاحية القسم .١-8‏ كما تقدم حالة عملية Y-A‏ تطبيقًا 
من منصة رئيسة أخرى لإنترنت الأشياء والتي تقوم بتسويقها جنرال إلكتريك. 
حالة عملية Y-A‏ 
التعاون المشترك بين بيتني باوز Pitney Bowes‏ ومنصة جدرال إلكتريك General‏ 
Electric IoT‏ لتحسين الإنتاج 

تعتبر Pitney Bowes‏ ومقرها الرئيس في ولاية كونيتيكت Connecticut‏ هي 
المورد الأمريكي لحلول التجارة الإلكترونية ومنتجات الشحن والبريد. تقوم آلات الشركة 
بتشغيل أو إنتاج معدل ١10١‏ مليون قطعة بريد في اليوم. ويقوم Enterprise Mail‏ 
Business‏ التابع ل Pitney Bowes‏ بتطوير gug‏ وخدمة OY‏ كبيرة تسمى -Inserters‏ 
تساعد هذه الآلات البنوك ومقدمي الرعاية الصحية على وضع قطعة البريد الصحيحة 
في المظروف ذي المقاس الصحيح. بالنسبة لبنك واحد. قامت هذه الآلة بتجميع 5٠١‏ 
مليون قطعة بريد في السنة. وتنتج معظم الآلات ۲٠٠٠١‏ رسالة في الساعة. وبهذا 
المستوى من الإنتاج JYI‏ تقوم Pitney Bowes‏ وعملاؤها أيضًا بإنتاج كمية ضخمة 
من البيانات كل يوم. وتسعى Pitney Bowes‏ لتحليل البيانات المتولدة من آلات 
البريد هذه للتنبؤ بأعطال الآلات مقدمًا ومن ثم منع أي انقطاع للخدمة وإصلاح الآلات 
قبل أن تتعطل. وقد اعتمدت GE Predix Pitney Bowes‏ كمنصة سحابة مصممة 
للإنترنت الصناعي؛ إذ تقوم منصة Predix‏ بتحليل بيانات جهاز الاستشعار OYU‏ 
وباستخدام التحليلات الفوريةء تقدم أفكارًا قوية تسهل اتخاذ القرارات. وبالإضافة إلى 
منع انقطاع الخدمة. تساعد التحليلات المقدمة من Predix‏ على تقليل وقت العطل 
وبالتالي زيادة الإنتاجية. وقد أدى التحليل الشامل لبيانات جهاز الاستشعار الذي 
تجريه Predix‏ إلى زيادة الإنتاجية وتحسين أداء الآلات. 
Sources: News.pb.com. (2015). GE and Pitney Bowes join forces to bring the power‏ 
of the industrial Internet to the world of commerce. http;//news.pb.com/article display.‏ 
cfm?article id-5634 (accessed August 2016); GEreports.com. (2016). The power of Predix:‏ 
An inside look at how Pitney Bowes is using the industrial Internet platform. http://‏ 
www.gereports.com/the-power-of-predixan-inside-look-at-how-pitney-bowes-has-‏ 
been-using-the-industrialinternet-platform/; (accessed August 2016); GE.com (2016).‏ 


Making machines intelligent is smart business. http://www.ge.com/digital/sites/default/ 
files/ge digital predix pb brochure.pdf, (accessed August 2016); GE.com. (2015). The 
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industrial Internet, Pitney Bowes and GE. http://blogs.pb.com/corporate/201514/07//the 
industrialinternet-pitney-bowes-and-ge/(accessed August 2016). 


بدء النظام البيئي لإنترنت الأشياء: 


تشرع العديد من الشركات المبتدئة في الظهور في مجال إنترنت الأشياء s‏ غضون ثلاث إلى 
أربع سنوات قادمة سنرى ازدهارًا Du‏ في صناعة إنترنت الأشياء. وقد نما رأس JU‏ ا مطروح في 
مشهد إنترنت الأشياءء من ۱,۸ بليون دولار في عام ۲۰۱۲ إلى ۲,۵۹ بليون دولار في عام ۲۰٠٤‏ ثم 
إلى PEt‏ بليون دولار في عام Y «Yo‏ ولعل من أبرز الأمثلة على الشركات الناشئة في إنترنت الأشياء: 
FreedomPops Jawbones Greenwaves Athoss Canarys 3D Roboticss Sigfox‏ 3 
-Rings Razer‏ 

وتعد Fitbit‏ من أنجح شركات إنترنت الأشياء» وهي شركة أمريكية تقوم بتصنيع متتبعات 
النشاطء وأجهزة تقنية لاسلكية تستخدم أجهزة استشعار لتحديد عدد خطوات المشيء ومعدل 
القلب» وجودة النوم» وخطوات التسلق» وغيرها من مقاييس الصحة الشخصية. 

كما تقوم شركات الاتصالات أيضًا باستكشاف وترويج إنترنت الأشياء. ويسعى معظم JLS‏ 
المشتغلين بالاتصالات مثل AT&T‏ إلى الاستفادة من هذه التقنية. ولتوفير الاتصال بالسيارات» 
أبرمت AT&T‏ شراكة مع A‏ شركات أمريكية لتصنيع السيارات من أصل ٠١‏ شركات تعمل في هذا 
المجال. وتعرض العديد من شركات الاتصالات شبكات الجيل الخامس القادمة الخاصة بها كحجر 
أساس لإنترنت الأشياء. 

يعتبر كل من Amazons Google/Alphabet‏ هما الأبرز في النظام البيئي لإنترنت الأشياء. 
كما تعد Google‏ بسحابة Google‏ التابعة لهاء SideWalk Labss‏ (مدن ذكية) والسيارات ذاتية 
القيادة مستثمرًا رائدًا في العديد من مبادرات إنترنت الأشياء. وقد أنتجت Amazon‏ باستخدام 
خدمات الويب أمازون (AWS)‏ التابعة لها منصة جديدة لإنترنت الأشياء والتي يمكن أن تعمل 
كخلفية لإنترنت الأشياء. ويقدم الشكل (P-A)‏ عرضًا esa‏ لمكونات النظام البيئي لإنترنت 
الأشياء والذي يشتمل على مجالات التطبيق المختلفة» وصانعي الأجهزة ومقدمي خدمة JUYI‏ 
ومطوري البرمجيات» ومستشاري التحليلات» وما إلى EUS‏ وهو مقتبس من مخطط النظام البيئي 
الذي تم تطويره وصيانته على المدونة: http://mattturck.com/2016/03/28/2016-iot-‏ 
landscape/‏ من قبل صاحبها Matt Turck‏ (تمت الزيارة في أغسطس (QM‏ 
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Sources: Adapted from matt, T(March, 2016). Internet of Things: Are We There Yet? 
http://mattturck.com/2016/03/28/2016-iot-landscape/ (accessed August 2016) . 


شكل P-A‏ النظام البيني لإنترنت الأشياء 

يتضمن هذا المخطط المفصل قائمة لشركات في كل مجموعة. ويبين الشكل (P-A)‏ أن فرص إنترنت 
الأشياء تتطور في BW‏ قطاعات رئيسة؛ إذ تشتمل المجموعة الأولى على الشركات التي توفر مجموعات 
بناء تقنيات وأدوات تمكين إنترنت الأشياء (الأجهزة والبرمجيات والاتصال والمستشارين / الحاضنات / 
التحالفات / الشركاء). وتشمل المجموعة الثانية المنصات والواجهات والطباعة ثلاثية الأبعاد الحديثة 
وموردي التقنية / الخدمة المتحدينء ويمكننا أن نطلق على هذه المجموعة اسم (موردو الخدمة طمطوري 
إنترنت الأشياء - قطاع أفقي)» في حين تتألف المجموعة الثالثة من قطاعات الصناعة» وهي المنطقة التي 
ستكون إلى حد كبير تطبيقات في قطاعات مختلفة وهي القطاع الشخصي والمنزل وا مركبات والمؤسسات 
والإنترنت الصناعي» حيث يقدم الشكل (P-A)‏ صورة واحدة لهذه المنظمة» بينما يتضمن موقع المدونة 
صورة مختلفة تتضمن أمثلة لشركات في كل من المجموعات الفرعية المحددة La‏ 
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اعتبارات إدارية فى إنترنت الأشياء: 


على الرغم من الإثارة الضخمة الدائرة حول نمو وإمكانية إنترنت الأشياء إلا أن هناك بعض 
القلق الذي ينبغي على المديرين eU‏ به. وقد gaz‏ معهد ماكنزي (McKinsey)‏ العاطمي 

bias Nuls (Y- 0)‏ ممتازًا لإنترنت الأشياء. 

ويحدد هذا التقرير القضايا التالية: 

-١‏ التوافق التنظيمي: على الرغم من صحة ذلك بالنسبة للكثير من مبادرات التقنية الأخرى فمع 
إنترنت الأشياء فإن فرص التحسينات التشغيلية وإيجاد فرص أعمال جديدة تعني أنه يجب على 
موظفي تقنية المعلومات وموظفي التشغيل أن يعملوا كفريق واحد وليس في وظائف منفصلة. 
وكما لاحظ مؤلفو «Jul‏ «فإن إنترنت الأشياء سوف يتحدى المفاهيم الأخرى للمسؤوليات 
التنظيمية. كما ينبغي على مديري أقسام المالية والتسويق «Jas clo‏ بجانب قادة وحدات 
«Jas‏ أن يكونوا متقبلين لربط أنظمتهم» )2015 McKinsey,‏ 


5] حتى الآن في نمو هذه الأنظمة؛‎ De تحديات العمل المشترك: يشكل العمل المشترك ضررًا‎ -Y 
هناك الكثير من المشاكل التقنية‎ GË لا تتصل جميع الأجهزة مع بعضها البعض بسلاسة.‎ 
وأيضًا تكون‎ caso مناسبة‎ Wi-Fi في الاتصالء ولا تملك العديد من المناطق النائية اتصالات‎ 
القضايا المتعلقة بمعالجة البيانات الضخمة مسؤولة عن التقدم البطيء في إنترنت الأشياء.‎ 
وتحاول الشركات تقليل البيانات على مستوى جهاز الاستشعار بحيث يتم تمرير الحد الأدنى‎ 
فقط من البيانات إلى السحابةء مما يجعل دعم البنية التحتية الحالية للكمية الضخمة من‎ 
مشكلة ذات صلة أخرى وهي تزويد‎ Jlag LS pal البيانات المتولدة من إنترنت الأشياء‎ 
الأجهزة بأجهزة استشعار لتكون قادرة على جمع ونقل البيانات للتحليلء ويستغرق الأمر‎ 
لتبدأ إنترنت الأشياء بشحن منتجهاء ثم من سنة إلى سنتين‎ a YE في ا متوسط من ۱۸ إلى‎ 
سيس تغرق المستهلكون وقنًا‎ CUS إضافيتين لتوزيع وبيع منتجها في السوق. وبالإضافة إلى‎ 
لاستبدال الأشياء المتناظرة بمنتجات ذكية جديدة من إنترنت الأشياء. وكمثال. فإنه بالنسبة‎ 
للناس يعد استبدال الهواتف الجوالة أسهل من استبدال السيارة وأدوات المطبخ والأقفال‎ 
وأشياء أخرى يمكن أن تستفيد من وجود جهاز استشعار وبقائه متصلًا مع إنترنت الأشياء.‎ 

Source: Cisco.com. (2015). Fog computing and the Internet of Things: Extend the Cloud to where the 


things are.  https://www.cisco.com/c/dam/en us/solutions/trends/iot/docs/computing-overview.pdf 
(accessed August 2016). 
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-Y‏ الأمان: هثل أمن البيانات قضية dale‏ ولكنها في سياق إنترنت الأشياء تعتبر قضية أكبر؛ إذ 
يصبح كل جهاز متصل ب إنترنت الأشياء نقطة دخول أخرى للقراصنة الأشرار للوصول إلى نظام 
كبيرء أو على الأقل تشغيل أو إتلاف الجهاز المحدد. فهناك قصص لقراصنة قادرين على الاختراق 
والتحكم في الوظائف الآلية للسيارة. أو السيطرة على فتح باب الجراج عن بعد. وتتطلب مثل 
هذه القضايا أن ينطوي أي اعتماد واسع النطاق لإنترنت الأشياء على اعتبارات أمنية منذ البداية. 
deg‏ الرغم من هذه الاعتبارات الإدارية» إلا أن النمو الناشئ في إنترنت الأشياء وإمكانياته 

لمساعدتنا في تحقيق الرؤية للمدن الذكية وللشبكة الذكية ولأي شيء SS‏ يعد أمرًا محيرًا. فهي 

إحدى المجالات المفتوحة الشاسعة للإبداع وريادة الأعمال. i‏ 


أسئلة مراجعة على القسم 7-8: 
-١‏ ما هي استخدامات إنترنت الأشياء الأساسية؟ 
؟- ما هي مجموعات البناء التقنية في إنترنت الأشياء؟ 
-Y‏ ما هي SRFID‏ 
£- إبحث على الإنترنت عن تطبيقات RFID‏ في الرعاية الصحية والترفيه والرياضة. 
0- حدد بعض أهم العاملين في النظام البيئي لإنترنت الأشياءء واستكشف عروضهم. 
1- اذكر بعض القضايا الرئيسة التي ينبغي على المديرين إدراكها عند استكشاف إنترنت الأشياء؟ 
Y-A‏ الحوسبة السحابية وتحليلات الأعمال: 

يوجد اتجاه تقني حديث الظهور ينبغي على مستخدمي تحليلات الأعمال PLNI‏ به وهو 
الحوسبة السحابية. ويعرّف المعهد الوطني pleat‏ والتقنية (NIST)‏ الحوسبة السحابية على 
أنها: «نموذج لتمكين الوصول إلى الشبكة المناسبة عند الطلب إلى مجموعة مشتركة من موارد 
الحوسبة القابلة للتشكيل (كالشبكات والخوادم والتخزين والخدمات) والتي هكن توفيرها 
وإصدارها بسرعة وبآقل جهد إداري أو تفاعل من مورد الخدمة» في حين تُعرّف ويكيبيديا (,.4.م 
(Cloud Computing‏ الحوسبة السحابية تعريقًا فضفامًا وشاملًا وهو: ”أسلوب حوسبة يتم 
من خلاله توفير الموارد القابلة للتطوير بشكل ديناميكي وغالبًا ما تكون افتراضية ويتم توفيرها 
عبر الإنترنت» ولا يحتاج المستخدمون إلى معرفة أو خبرة في أو التحكم في البنى التحتية للتقنية 
في السحابة التي تدعمهم“. ومن ناحية أخرىء تعد الحوسبة السحابية U Lad‏ جديدًا للعديد 
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من الاتجاهات السابقة ذات الصلةء كحوسبة المرافق» وحوسبة شبكة مقدم خدمات التطبيق» 
والحوس d.‏ عند الطلب» والبرمجيات كخدمة (SaaS)‏ وحتى الحوسبة المركزية القدهة باستخدام 
المحطات الصامتة. غير أن مصطلح الحوسبة السحابية ينتج أصلًا من إشارة إلى الإنترنت باعتباره 
«سحابة» ويمثل تطورًا في جميع اتجاهات الحوس بة المشتركة / المركزية السابقة. ويعرف القائم 
بالإدخال في ويكيبيديا LÉ‏ أن الحوسبة السحابية هي مزيج من عدة مكونات لتقنية المعلومات 
كخدمات. فعلى سبيل JEL‏ تشير البنية الأساسية كخدمة (Taas)‏ إلى توفير منصات الحوسبة 
كخدمة (PaaS)‏ بالإضافة إلى توفير منصة أساسيةء مثل إدارة الحكومة والأمان» وما إلى ذلك» 
وتتضمن SaaS Léif‏ والتي تشتمل على تطبيقات يتم نقلها من خلال متصفح ويبء في حين تكون 
البيانات وبرامج التطبيقات موجودة على خادم آخر. 

بالرغم من أننا Šole‏ لا ننظر إلى البريد الإلكتروني على الويب JÈS‏ للحوسبة السحابية» إلا أنه 
هكن اعتباره تطبيقًا سحابيًا أساسيًا. Sales‏ ما يقوم تطبيق البريد الإلكتروني بمستودعات البيانات 
(رسائل البريد الإلكتروني) والبرمجيات (برامج البريد الإلكتروني التي تسمح UJ‏ بمعالجة وإدارة 
رسائل البريد الإلكتروني). ويوفر مزود البريد الإلكتروني أيضًا الأجهزة / البرامج والبنية الأساسية 
بالكامل. وطاما JE‏ الإنترنت متاحًاء يكون الوصول إلى تطبيق البريد الإلكتروني من أي مكان 
في السحابة ممكنًا. وعندما يتم تحديث التطبيق من قبل مزود البريد الإلكتروني as)‏ عندما 
يقوم Gmail‏ بتحديث تطبيق البريد الإلكتروني الخاص 45( فإنه يصبح Blia‏ لجميع العملاء 
دون حاجتهم لتنزيل أي برامج جديدة. ومن أمثلة الحوسبة السحابية أيضًا مواقع الشبكات 
الاجتماعية على الويب مثل dido -LinkedIns Twitters Facebook‏ يعتبر أي تطبيق عام 
على الويب مثالا على تطبيق سحاي. وهناك مثال آخر على تطبيق السحابة العامة وهو وثائق 
وجداول البيانات من ‘Google‏ حيث يسمح هذا التطبيق للمستخدم بإنشاء وثائق نصية أو 
جداول بيانات والتي يتم تخزينها على خوادم Google‏ وتكون متاحة للمستخدمين من أي 
مكان يمكنهم الوصول إلى الإنترنت فيه. ومرةً أخرى لا يحتاج المستخدم تثبيت أي برامج باسم 
«التطبيق في السحابة». كما أن مساحة التخزين موجودة Lél‏ «في السحابة». 

وهناك مثال جيد على الأعمال العامة للحوسبة السحابية وهو خدمات الويب الخاصة بشركة 
¿a> ‘Amazon.com‏ قامت Amazon.com‏ بتطوير بنية تحتية تقنية مذهلة لكل من التجارة 
الإلكترونية وذكاء الأعمال وإدارة علاقات العملاء وإدارة سلاسل التوريدء كما قامت بإنشاء مراكز 
بيانات رئيسة لإدارة عملياتها الخاصة. ومع US‏ ومن خلال الخدمات السحابية في Amazon.‏ 
com‏ هكن للعديد من الشركات الأخرى استخدام نفس هذه التسهيلات للحصول على مزايا 
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هذه التقنيات دون القيام باستثمار مماثل. وكما هو الحال في خدمات الحوسبة السحابية 
الأخرىء يستطيع المستخدم أن يشترك في أي من التسهيلات على أساس: ادفع - كما - تذهب 
(Pay as you go)‏ ويعد هذا النموذج من السماح لشخص آخر بامتلاك الأجهزة والبرمجيات 
مع صنع استخدام التسهيلات على أساس الدفع - لكل - استخدامًا بمثابة حجر الزاوية في الحوسبة 
السحابية. ويوفر عدد من الشركات خدمات الحوسبة السحابية. Salesforce.com Jis‏ و(18M‏ 
Googles (Microsoft Azure)s (Bluemix‏ وغيرها. 


وكما هو الحال في العديد من اتجاهات تقنية المعلومات الأخرىء فقد أنتجت الحوسبة 
السحابية عروضًا bwas‏ في ذكاء الأعمال؛ حيث تسمح هذه الخيارات للمنظمة بتطوير مستودع 
بياناتها والدفع فقط نظير ما تستخدمه بالفعل. وقد يستخدم المستخدم النهائي لخدمة ذكاء 
الأعمال القائمة على السحابة منظمة واحدة لتطبيقات التحليل والتي تستخدم في LAL‏ شركة 
أخرى للمنصة أو للبنية التحتية. وتلخص المقاطع المتعددة التالية أحدث الاتجاهات في واجهة 
الحوسبة السحابية وذكاء الأعمال / تحليلات الأعمال )2013 (Demirkan & Delen,‏ 

ويوضح الشكل (E-A)‏ بنية مفاهيمية لبيئة دعم القرار الموجهة بالخدمات» والتي تعتبر نظام 
تحليلات قائم على السحابة. وفي هذا الشكل يتم دمج الخدمات القائمة على السحابة مع بنية 
التحليلات العامة المقدمة في الفصول السابقة. 
إدارة العمليات إدئرة المملوماث 
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وقي Jo 1o‏ دعم القرار الموجهة بالخدمات» يمكن الحصول على العناصر التالية ds‏ على حدة 
أو مجتمعة وتقدهها للمستخدمين كخدمةء وهذه العناصر هي: 


-١‏ أنظمة التشغيل. 
-Y‏ مستودعات البيانات. 
-Y‏ المعالجة التحليلية الفورية. 
-E‏ مكونات المستخدم النهائي. 

ويمكن الحصول على إحدى أو كل هذه الخدمات من خلال السحابة. ولأن مجال الحوسبة 
السحابية يتطور سريعًا gaisg‏ بإيقاع متسارع» فقد نتج عن ذلك التباس كبير في المصطلحات 
المستخدمة من جانب مختلف الموردين والمستخدمينء فتختلف المسميات من حيث البنية الأساسية 
والمنصة والبرمجيات والبيانات والمعلومات والتحليلات كخدمة. ونعرّف فيما يلي هذه الخدمات» 
ثم نلخص المنصات التقنية dod]‏ ونسلط الضوء على تطبيقات لكل منها من خلال حالات عملية. 
البيانات كخدمة :(DaaS)‏ 

يدافع مفهوم البيانات كخدمة بشكل أساسي عن وجهة النظر التي تقول: «أين تعيش 
البيانات» حيث لا تهتم المنصة الفعلية بمكان إقامة البيانات. فقد تتواجد البيانات في جهاز 
حاسب محلي أو في خادم في مزرعة خوادم داخل بيئة الحوسبة السحابية. ومع Daas‏ يمكن لأي 
عملية أعمال الوصول إلى البيانات أينما وجدت. بدأت البيانات كخدمة بفكرة أن جودة البيانات 
تحدث في مكان مركزي» وتطهير وإثراء البيانات وعرضها على أنظمة أو تطبيقات أو مستخدمين 
مختلفين» بغض النظر عن مكان وجود تلك البيانات سواء في المنظمة» أو على أجهزة الحاسب» 
أو على الشبكة. والآنء تم استبدال هذا بإدارة البيانات الأساسية وحلول تكامل بيانات العملاء 
حيث هكن أن تتواجد سجلات العملاء (أو المنتجات» أو الأصولء إلخ) في أي مكان» وتكون متاحة 
كخدمة لأي تطبيق به خدمات تسمح بالوصول إليها. ومن خلال تطبيق مجموعة قياسية من 
التحويلات على المصادر المتنوعة للبيانات (كأن يتم التأكد من أن الحقول الخاصة بالجنس والتي 
تحتوي على أنماط رمزية مختلفة [M/F Mr/Ms Jio]‏ تتم ترجمتها جميعًا إلى ذكر / أنثى) ثم 
تمكين التطبيقات من الوصول إلى البيانات عبر واجهات مفتوحة مثل «XML3 XQuerys SQL‏ 
بحيث يكن لطالبي الخدمات الوصول إلى البيانات دون الحاجة إلى المورد أو النظام. 
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وباستخدام Daas‏ يستطيع العملاء الانتقال بسرعة وذلك لسهولة الوصول إلى البيانات وحقيقة 
أنهم ليسو بحاجة إلى معرفة شاملة بالبيانات الأساسية. فإذا طلب العملاء بنية بيانات مختلفة إلى 
حد ما أو متطلبات خاصة بالموقع» تكون الاستجابة لهم سهلة لأن التغييرات تكون عند dol‏ حد لها 
(رشيقة). GË‏ يستطيع مقدمو الخدمة بناء القاعدة بالاستعانة بخبراء البيانات ومصادر خارجية 
لطبقات التحليل أو التقديم (والتي تتيح للمستخدم واجهات فعالة جدًا من حيث التكلفة كما 
تجعل طلبات التغيير في طبقة التقديم أكثر جدوى) ويتم التحكم في الوصول إلى البيانات من خلال 
خدمات البيانات» ويتجه إلى تحسين جودة البيانات GY‏ هناك نقطة واحدة للتحديثات. 
البرمجيات كخدمة (Sهه؟):‏ 

يتيح هذا النموذج للمستهلكين استخدام التطبيقات والبرامج التي يتم تشغيلها على أجهزة 
الحاسب البعيدة في البنية التحتية للسحابة. ولا يحتاج المستهلكون أن يهتموا بإدارة البنية 
التحتية للسحابة؛ فيجب عليهم الدفع مقابل استخدام البرمجيات فقط. وكل ما نحتاج إليه هو 
متصفح ويب للاتصال بالسحابة. وتقدّر شركة جارتنر أن إيرادات SaaS‏ في عام ۲۰۱۰ حوالي YY‏ 
مليار دولار أمريي وتستخدم في ZW‏ من جميع المنظمات. وتعتبر كل من Picasa Gmail‏ و 
Flickr‏ أمثلة على SaaS‏ 
المنصة كخدمة :(PaaS)‏ 

وباستخدام هذا النموذج» تستطيع الشركات نشر البرمجيات والتطبيقات الخاصة بها في السحابة 
بحيث هكن استخدامها من قبل العملاء. ولا يتعين على الشركات إدارة الموارد المطلوبة لإدارة 
تطبيقاتها في شبكات تشبه السحابة أو الخوادم أو التخزين أو أنظمة التشغيلء liag‏ يقلل من تكلفة 
صيانة البنية التحتية الأماسية لتشغيل برامجهم كما يوفر أيضًا وقت إعداد هذه البنية التحتية. 
والآن» يستطيع المستخدمون التركيز فقط على أعمالهم دون التركيز على إدارة البنية التحتية لتشغيل 
برامجهم. ومن الأمثلة على -Google App Engines Amazon EC25 Microsoft Azure :PaaS‏ 
البنية التحتية كخدمة :(laaS)‏ 

في هذا النموذج» يتم توفير موارد البنية التحتية كالشبكات والتخزين والخوادم وموارد 
الحوسبة الأخرى لشركات العملاء؛ إذ يستطيع العملاء تشغيل تطبيقاتهم والحصول على حقوق 
إدارية لاستخدام هذه الموارد ولكنهم لا يديرون البنية التحتية الأساسية. ويجب على العملاء 
الدفع مقابل استخدام البنية التحتية. وخير مثال على ذلك هو خدمات الويب في Amazon.‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري veo‏ 


الفصل الثامن 


.com‏ فقد طورت Amazon.com‏ بنية تحتية تقنية رائعة تتضمن مراكز «obla‏ بحيث هكن 
للشركات الأخرى استخدام خدمات السحابة التابعة ل Amazon.com‏ بنظام الدفع - لكل - 
استخدام دون الحاجة إلى عمل استثمارات مماثلة. 

يجب أن نلاحظ أن هناك الكثير من الالتباس والتداخل في استخدام مصطلح السحابة. فعلى 
سبيل «JUL‏ يضيف بعض الموردين أيضًا ا معلومات كخدمة (148) والتي تعد امتدادًا ل Daas‏ 
ومن الواضح أن TaaS‏ تختلف عن «البنية التحتية كخدمة» التي تم شرحها منذ قليل. ويكون هدفنا 
هنا هو التعرف فقط على وجود درجات متفاوتة من الخدمات التي يمكن لأي منظمة الاشتراك فيها 
لإدارة تطبيقات التحليلات. ويس لط الشكل (0-8) الضوء على مستوى الاشتراكات في الخدمة التي 
يستخدمها العميل في كل نوع من الثلاثة للعروض السحابية الرئيسة. ويتضح من الشكل أن SaaS‏ 
db‏ في ا مستوى الأعلى من الخدمة السحابية التي قد يحصل عليها العميل. فمثلا عند استخدام 
Office 5‏ تستخدم إحدى المنظمات البرمجيات كخدمة: ويكون العميل هو ال مسؤول الوحيد عن 
إحضار البيانات» وتقع العديد من التحليلات كتطبيق خدمة في هذه الفئة LAÍ‏ 
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شكل :0-A‏ حزمة التقنية كخدمة لأنواع مختلفة من عروض السحابة 
التقنيات الأساسية للحوسبة السحابية: 


الافتراضية: وهي إنشاء نسخة افتراضية لشيء يشبه نظام التشغيل أو الخادم. ومن الأمثلة 
البسيطة على الافتراضية هو التقسيم المنطقي لمشغل الأقراص الصلبة لإنشاء مشغلين منفصلين 
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للأقراص الصلبة في الحاسب. ويمكن للافتراضية أن توجد في جميع المجالات الثلاثة للحوسبة كما ياي: 

- افتراضية الشبكة: أي تقسيم السعة التنزيلية المتاحة إلى قنوات» وهذا يعمل على إخفاء تعقيد 
الشبكة بتقسيمها إلى أجزاء يمكن إدارتهاء ثم بعد ذلك هكن تخصيص كل سعة تحميلية لخادم 
أو جهاز معين بشكل فوري. 

- افتراضية التخزين: هو تجميع التخزين المادي من أجهزة تخزين شبكة متعددة إلى جهاز 
تخزين واحد يمكن إدارته من وحدة التحكم ال مركزية. 

- افتراضية الخادم: وهو إخفاء الخوادم المادية عن مستخدمي الخادم» ولا يتعين على المستخدمين 
إدارة الخوادم الفعلية أو فهم التفاصيل المعقدة لموارد الخادم. 

ويرتبط هذا الاختلاف في مستوى الافتراضية مباشرةً مع الخدمة السحابية المستخدمة. 


نماذج نشر السحابة: 


هكن الحصول على الخدمات السحابية بعدة طرق» من بناء بنية تحتية خاصة بالكامل إلى 

المشاركة مع الآخرين. وتعد النماذج الثلاثة التالية هي الأكثر شيوعًا: 

- سحابة خاصة: ويطلق عليها Ll‏ سحابة داخلية أو سحابة الشركات» وهي صورة للخدمة 
السحابية أكثر أمانًا من السحب العامة مثل «Google BigQuerys MS Azure‏ ويتم تشغيلها 
فقط بمؤسسة واحدة ذات عبء عمل المهام الحاسمة والمخاوف الأمنيةء وهي توفر نفس 
الفوائد كخدمة dale‏ شبيهة بالسحابةء والقابلية للتغيير. وتغيير موارد الحوسبة حسب isl‏ 
وما إلى ذلك. وتتمتع الشركات التي لديها سحابة خاصة بالتحكم المباشر على بياناتها وتطبيقاتها. 
وتكمن عيوب امتلاك سحابة خاصة في تكلفة صيانة وإدارة السحابة حيث يكون طاقم عمل 
تقنية المعلومات في الشركة هو المسؤول عن إدارتها. 

- سحابة عامة: ds‏ هذا النموذج» يستخدم المشترك الموارد المعروضة من جانب مقدمي الخدمة على 
الإنترنت» وتتم إدارة البنية التحتية للسحابة بواسطة مقدم الخدمة. وتنمثل الليزة الأساسية لنموذج 
السحابة العامة هذا في توفير وقت وتكلفة إعداد الأجهزة والبرامج المطلوبة لتنفيذ الأعمال. ومن 
أمثلة السحابة العامة منصة -Amazon AWSs Google App Engines Microsoft Azure‏ 

- سحابة مختلطة: تمنح السحابة المختلطة الأعمال مرونة كبيرة بنقل أعباء العمل بين السحب 
الخاصة والعامة. فعلى سبيل المثالء تستطيع أي شركة أن تستخدم التخزين السحابي المختلط 
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لتخزين obla‏ المبيعات والتسويق الخاصة بهاء ومن $ استخدام منصة سحابة عامة Jis‏ 
Amazon Redshift‏ لتنفيذ الاستعلامات التحليلية لتحليل بياناتها. ويعد المطلب الرئيس هو 
الاتصال الشبكي وتوافق API‏ (واجهة برمجة التطبيقات) بين السحابتين الخاصة والعامة. 
كبار موردي منصة السحابة في التحليلات: 
نحدد في هذا القسم ol‏ بعض المشغلين الأساسيين للسحابة التي توفر البنية الأساسية 
للتحليلات dadas‏ بالإضافة إلى وظائف التحليلات المختارة. ثم نذكر أيضًا عروض التحليلات - 
كخدمة التمثيلية التي قد تعمل حتى على منصات السحابة هذه. 
Elastic Beanstalk‏ 1 وهي خدمة مقدمة من خدمات ويب Amazon‏ وهي 
تستطيع نشر وإدارة وتطوير تطبيقات الويب وتدعم لغات البرمجة التالية: Rubys Java‏ و 
NET PHPs Python‏ على خوادم مثل Apache Tomcats Apache HTTP‏ و115. ويجب 
على المستخدم Ja x3‏ رمز التطبيق» ويقوم Elastic Beanstalk‏ بنشر التطبيق» وموازنة العبء 
والقياس JALI‏ ومراقبة صحة التطبيق. ولذا؛ يستطيع المستخدم التركيز على بناء مواقع الويب» 
وتطبيقات الجوالء وخلفية API‏ وأنظمة إدارة المحتوى» «SaaS‏ وما إلى ذلك في حين يركز Elastic‏ 
Beanstalk‏ على التطبيقات والبنية التحتية لإدارتها. كما يمكن للمستخدم استخدام خدمات ويب 
gÍ Amazon‏ بيئة تطوير متكاملة مثل Eclipse‏ أو Visual Studio‏ لتنزيل تطبيقهم. ويجب Ul‏ 
على المستخدم دفع تكاليف موارد AWS‏ اللازمة لتخزين وتنفيذ التطبيقات. 
:IBM Bluemix‏ وهو منصة سحابة تتيح للمستخدم إنشاء تطبيقات باستخدام عدة تقنيات 
مجانية على الحاسبء كما GSE‏ المستخدمين من نشر وإدارة التطبيقات المختلطة باستخدام 
البرنامج. ومع IBM Watson‏ والتي تتوفر خدماتها على IBM Bluemix‏ يستطيع المستخدمون 
الآن إنشاء تطبيقات إدراكية للجيل القادم والتي تستطيع الاكتشاف والابتكار, واتخاذ القرارات. 
كما يمكن استخدام خدمات IBM Watson‏ لتحليل العواطف وتحويل النص إلى كلام مسموع 
بصوت طبيعي» حيث يستخدم Watson‏ مفهوم الحوس بة الإدراكية لتحليل النصوص ومقاطع 
الفيديو والصورء وهو يدعم لغات البرمجة مثل -Pythons Ruby; PHPs Gog Java‏ 
Microsoft Azure‏ : قامت مايكروسوفت (Microsoft)‏ بإنشاء منصة سحابية تسمى Azure‏ 
لتقوم بإنشاء ونشر وإدارة التطبيقات والخدمات من خلال شبكة مراكز بيانات مايكروسوفت 
(Microsoft)‏ وهي تعمل على شكل كل من PaaS‏ و1435 وتقدم العديد من الحلول كالتحليلات 
ومستودعات البيانات والمراقبة عن بُعد والصيانة التنبؤية. 
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:"Google App Engine‏ وهو منصة حوسبة سحابية من خدمات Google‏ تُستخدم لتطوير واستضافة 
التطبيقات» وهي JS‏ من خلال مراكز بيانات Google‏ تدعم تطبيقات التطوير في لغات برمجة Python‏ 
Rubys Javas‏ و PHP‏ وتوفر بيئة BigQuery‏ خدمات مستودع البيانات من خلال السحابة. 

:OpenShift‏ وهوعبارة عن منصة تطبيقات سحابية تابعة ل Red Hat‏ قانئمة على موذج 
5. ومن خلال هذا النموذج» يتمكن مطورو التطبيقات من نشر تطبيقاتهم على السحابة. 
ويتوفر نموذجان مختلفان .OpenShift. J‏ يعمل أحدهما بمثابة PaaS‏ العامة والآخر ilig‏ 
5 الخاص. إن OpenShift Online‏ هونظام PaaS‏ العام في Red Hat‏ والذي يعرض تطوير 
وبناء واستضافة ونشر التطبيقات في السحابة. ويسمح PaaS‏ الخاص, OpenShift Enterprise‏ 
بتطوير وبناء ونشر التطبيقات على خادم داخلي أو منصة سحابية خاصة. 


التحليلات كخدمة :(AaaS)‏ 


تعتبر التحليلات والحلول الإدارية القائمة على البيانات بمثابة التطبيقات التي تستعلم عن 
البيانات لاستخدامها في تخطيط الأعمال. وحل المشكلات. ودعم القرارء وهي تتطور بسرعة 
وتُستخدم تقريبًا من جانب جميع المنظمات. ويتم إغراق المؤسسات با معلومات» Higg‏ الحصول 
على أفكار من هذه البيانات Guas‏ كبا لها. وبالإضافة U‏ توجد تحديات تتعلق بأمن 
وجودة البيانات والالتزام. ويعتبر AaaS‏ منصة تحليلية قابلة للتوسع باستخدام نموذج التوصيل 
القائم على السحابةء حيث تقوم أدوات تحليل بيانات ذكاء الأعمال والبيانات المختلفة بمساعدة 
الشركات في صنع القرار بشكل أفضل والحصول على أفكار من بياناتها الضخمة. وتغطي المنصة 
جميع النواحي الوظيفية ابتداءً من جمع البيانات من الأجهزة المادية وانتهاءً بتصوير البيانات. 
ويوفر AaaS‏ للشركات نموذجًا CSS‏ لإعداد التقارير والتحليلات مما مكنهم من التركيز على ما 
يفعلون بأفضل ما يمكن. كما يمكن للعملاء تنفيذ تطبيقاتهم التحليلية الخاصة في السحابة أو 
وضع بياناتهم على السحابة واستقبال أفكار مفيدة. 

وتضم AaaS‏ جوانب الحوسبة السحابية إلى تحليلات البيانات الضخمة؛ elole Gg‏ البيانات 
والمحللين من خلال السماح لهم بالوصول إلى مجموعات بيانات المعلومات التي تتم إدارتها بشكل 
مركزي. وهكنهم الآن استكشاف مجموعات بيانات المعلومات بصورة تفاعلية أكثر واكتشاف 
الأفكار الأكثر ELS‏ بشكل g et‏ وبالتالي تجنب العديد من التأخيرات التي قد يواجهونها أثناء 
اكتشاف اتجاهات البيانات. فمثلًاء قد يوفر المورد الوصول إلى منصة تحليلية عن بُعد في مقابل 
دفع رسوم» ويتيح ذلك للعميل استخدام برامج التحليلات كلما لزم الأمر. ويعتبر 4285 جزءًا من 
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TaaSs PaaSs SaaS‏ وبالتالي يساعد تقنية المعلومات بشكل معنوي على تقليل كل من التكاليف 
وخطر الالتزامء في حين يرفع من إنتاجية ا مستخدمين. 

على سبيل «Jill‏ يصل موظفو eBay‏ إلى شريحة افتراضية لخادم مستودع البيانات الرئيس 
بحيث هكنهم تخزين وتحليل مجموعات البيانات الخاصة بهم. وقد حققت أسواق بيانات eBay‏ 
الافتراضية الخاصة نجاحًا كبيرًا فيما يتراوح من ٥١‏ إلى ٠٠١‏ عملية في وقت واحد. وقد ألغت أسواق 
البيانات الافتراضية احتياج الشركة إلى أسواق بيانات مادية جديدة, والتي تقدر تكلفتها مليون 
دولار لكل منها وتتطلب اهتمامًا طوال الوقت من عدة موظفين ذوي مهارات )2008 (Winter,‏ 

لدى AaaS‏ في السحابة وفورات الحجم والمدى من خلال توفير العديد من التطبيقات 
التحليلية الافتراضية مع مزيد من القابلية للتطوير وتوفير التكلفة. ومع تزايد أحجام البيانات 
وعشرات من التطبيقات التحليلية الافتراضية, تكون هناك فرص بأن الكثير منها يستفيد بالمعالجة 
في أوقات مختلفة, وأنماط الاستخدام, والتكرارات )2011 (Kalakota,‏ 

يعتبر التنقيب في كل من البيانات والنصوص تطبيقًا آخر واعدًا lip‏ من 4285. هكن Lal‏ استخدام 
الإمكانيات التي يجلبها توجيه الخدمة (بجانب الحوسبة السحابية والموارد المجمّعة والمعالجة المتوازية) 
إلى ble‏ التحليلات من أجل التحسين واسع النطاق» ومشاكل القرارات متعددة المعايير ا معقدة Mer‏ 
ونماذج المحاكاة الموزعة» ثم نحدد بعد ذلك عروض التحليلات المنتقاة والقائمة على السحابة. 
التحليلات الممثلة كعروض خدمة: 

تحليلات ASTER‏ كخدمة: تعتبر Teradata Aster‏ هي المحرك الرئيس في تقديم التحليلات 
كخدمة. وتشتمل Aster‏ على كل من Aster MapReduce Analytics Foundation‏ (تسمح 
بمعالجة البيانات عبر مجموعات هائلة من Aster Graph Analyticss {OLLI‏ مع كثير من 
أدوات ذكاء الأعمال الأخرى. ومع «Aster AaaS‏ تستطيع الشركات الحصول على أفكار قيّمة من 
بياناتهاء مما يساعدها في اتخاذ قرارات «abl‏ دون عمل أي استثمار صريح في البنية التحتية. 

:IBM WATSON ANALYTICS‏ توفر IBM‏ جميع عروض التحليلات من خلال خدمة 
السحابة Bluemix‏ الخاصة بها؛ حيث يقوم IBM Watson Analytics‏ بدمج معظم خصائص 
وإمكانيات التحليلات التي يمكن بناؤها ونشرها من خلال .Bluemix‏ بالإضافة إلى ذلك قدم 
IBM Watson Cognitive‏ عرضًا أساسيًا قائمًا على السحابة يستخدم التنقيب في النص والتعلم 
العميق بمستوى ir Jie‏ وقد عرضنا لذلك من قبل في سياق الحديث عن التنقيب في النص. 
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111:01 يعد التنقيب في النص واحدًا من المجالات النامية في عام 
التحليلات. يعمل التنقيب à‏ النص على تحديد موضوعات الوثائق ذات المستوى العالي» واستنتاج 
المشاعر من الاستعراضات» وتصوير الوثيقة أو علاقات المصطلح / المفهوم وقد تم شرح ذلك 
بالتفصيل في فصل التنقيب في النص. وتقدم MineMyText.com‏ هذه الإمكانيات في السحابة 
من خلال موقع الويب الخاص بهم. 

تحليلات وإحصاءات SAS‏ المرئية: يوفر معهد SAS‏ برمجيات التحليلات الخاصة به عند 
الطلب من خلال السحابة. وحاليًاء تتوفر إحصاءات SAS‏ المرئية فقط كخدمة سحابة وتكون 
منافسة ل „Tableau‏ 

TABLEAU‏ وهو أحد أهم البرامج المرئية وقد تم تقدهه في سياق الحديث عن التحليلات 
الوصفيةء ويتوفر LÀ)‏ من خلال السحابة. 

:SNOWFLAKE‏ وهو أحد حلول مستودعات البيانات القائمة على السحابة؛ حيث يستطيع 
ال مستخدمون gar‏ بياناتهم من مصادر متعددة كمصدر واحد وتحليلها باستخدام „Snowflake‏ 

:PREDIX BY GENERAL ELECTRIC‏ كما ذكرت التقاریرء أن جنرال إلكتريك تركز 
على تطوير منصة إنترنت الأشياء للتحليلات التنبؤية لمساعدة عملائها في الوصول إلى تشغيل 
وإدارة المعدات والمنصات الصناعية بشكل أفضل. وقد طورت الشركة عرضًا تحليليًا جديدًا 
يطلق عليه Predix‏ (وقد تمت مناقشته في حالة عملية (Y-A‏ وهو متوفر عبر السحابة من خلال 
خدمات Amazon Web Services‏ وسيتوفر قريبًا من خلال -Microsoft Azure‏ 
تطبيقات تحليلات توضيحية باستخدام البنية التحتية للسحابة: 

في هذا القسم» نسلط الضوء على عدة تطبيقات تحليلات سحابية» وسنعرضهم كقسم واحد 
في مقابل حالات عملية منفردة. 

مركز MD Anderson‏ للسرطان يستخدم إمكانيات الحوسبة الإدراكية لشركة 
gab IBM Watson‏ مرضى السرطان علاجًا أفضل: 

يعتبر مركز جامعة Texas MD Anderson‏ للسرطان (والذي يطلق عليه مركز 
3 للسرطان) lols‏ من أفضل مستشفيات السرطان في الولايات المتحدة. 
فمنذ عام ۱٤۱۹ء gle‏ مركز MD Anderson‏ للسرطان ٩۰۰‏ ألف مريض بالسرطان 
ولديه Jis‏ 19 ألف موظف. 
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حيث يتم في كل عام eMe‏ حوالي ٠٠١‏ آلف مريض بالسرطان في MD Anderson‏ 
ومحيطه المحلي والقومي. ونتيجة لذلك؛ تراكم لدى المركز الكثير من البيانات الإكلينيكية 
للأورام تخص مرضى المركز. وتش مل البيانات الرعاية المقدمة للمرضىء والتجارب 
الإكلينيكية» ونتائج اختبارات المرضىء ويتم ذلك بشكل يوميء سواء في ملاحظات الباحثين 
والأطباء أو الموجودة في قواعد البيانات عن asi‏ وملفات الأطباء الآخرين الذين عالجوا 
هؤلاء ا مرضى في الماضي. وقد أدرك مسؤولو MD Anderson‏ أنه إذا تم gae‏ وتحليل 
كل هذه المجموعة من البيانات الضخمة في مصدر واحد وتحليلهاء فسوف يساعد ذلك 
الأطباء في التجارب الإكلينيكية ومن e$‏ تحديد أفضل اختيارات لعلاج مرضاهم. 





“Moon Shots" برنامجًا بعنوان‎ MD Anderson عام 1 أصدر مسؤولو‎ às 
للعثور على علاجات أفضل للسرطان. كما‎ IBM Watson وقاموا بإجراء تحليلات لمحتوى‎ 
تجمع كل البيانات المتفرقة غير المهيكلة‎ APOLLO قاموا بتطوير منصة تقنية تسمى‎ 
IBM حيث يتكامل‎ (EMR) للمرضى في نظام واحد للسجلات الطبية الإلكترونية‎ 
ويستخدم تحليلات ال محتوى لإنشاء ملف تعريف‎ EMR بسلاسة مع نظام‎ Watson 
شامل لكل مريض بالسرطان في شكل مهيكل للأطباء. فهي تساعد الأطباء على التشخيص‎ 
من إجراء مقارنة بين ا مرضى استنادًا إلى مجموعة جديدة‎ ps الأفضل لحالة ا مريض‎ 
MD Anderson من السمات المعتمدة على البيانات. والآن» يستطيع فريق أطباء مركز‎ 
مقارنة مجموعة من المرضى لتحديد أولئك الذين يستجيبون بشكل مختلف للعلاجات‎ 
واكتشاف السمات ال مسؤولة عن هذه الاختلافات. كما يمكن للأطباء الآن عرض المرضى‎ 
على المشاركة في التجارب الإكلينيكية على العلاجات الجديدة بناءً على الدليل والخبرة.‎ 
Sources: MDanderson.org. (2013). MD Anderson taps IBM Watson to power 
“Moon Shots" mission. https//www.mdanderson.org/newsroom/201310//md- 
anderson-ibm-watson-work-togetherto-fight-cancerhtml ^ (accessed August 
2016); IBM.com (2015). Smarter care at MD Anderson. http://www-03.ibm.com/ 
software/businesscasestudies/us/en/corp?synkey-H447240O66679238 ^ (accessed 
August 2016); YouTube.com. (2014). Smarter care at MD Anderson. https://www. 
youtube.com/watch?v-savJ8VQOkcA (accessed August 2016). Wikipedia.org. (n.d.). 


University of Texas MD Anderson Cancer Center. https;//en.wikipedia.org/wiki/ 
University of Texas MD Anderson Cancer Center (accessed August 2016). 
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مدارس التعليم العام فيتاكوماء واشنطون تستخدم Microsoft Azure Machine Learning‏ 
للتنبؤ بالتسربات من التعليم: 

تعتبر مدارس تاكوما العامة هي الإدارة التعليمية الرئيسة في تاكوماء واشنطن. 
وتتكون من YO‏ مدرسة ابتدائية و٩‏ مدارس متوسطة و٩‏ مدارس ثانوية. وهي تعتبر ثالث 
أكبر إدارة تعليمية في ولاية واشنطن, بأكثر من ٠٠٠٠١‏ طالب وأكثر من ٥٠٠١‏ موظف. 


وقد أشارت دراسة أجريت في عام ۲۰۰۷ إلى خمس مدارس ثانوية من مدارس تاكوما 
العامة على أنها ”مصانع للتسرب“. وبحلول عام "١٠١‏ كان الموقف في غاية السوء. فقد 
حصل فقط 00 من طلاب المدارس الثانوية على شهادة الدبلوم الخاصة بهم في الوقت 
المحددء وهومعدل أقل بكثير من المعدل الوطني البالغ AA‏ كان لدى الإدارة التعليمية 
الكثير من البيانات الخاصة بالطلاب كدرجات الاختبارء وأماكن الإقامةء ومدارسهم 
الابتدائية والمتوسطة التي أتوا منها. فأرادو! باستخدام هذه البيانات أن يوجدوا حلا لرفع 
معدلات التخرج. كما أرادوا É‏ التنبؤ المسبق بالطلاب الذين من المحتمل تسربهم 
من التعليم» وذلك منحهم اهتمامًا خاضًا مشاكل الطفل ومن ثَّمْ اتخاذ إجراءات وقائية. 

شرعت مدارس تاكوما العامة في استكشاف حلول متنوعة لذكاء الأعمال من 
أجل تحلیل بياناتها. وتعاونت خدمات استشارات مايكروسوفت (Microsoft)‏ مع 
ا لمنطقة التعليمية وقامت بإنشاء مستودع بيانات يلتقط معلومات تخص الطالب 
كالصحة والدرجات ونسبة الحضور وتفاصيل إضافية مستقاة من أنظمة معلومات 
طلاب المدرسة. كما ساعدت خدمات الإكسيل التابعة لمايكروسوفت (Microsoft)‏ 
SharePoints‏ المدرسين في مراجعة البيانات التاريخية لطلابهم والإجراءات التي تم 
اتخاذها على المقاييس المشاهدة. وقد ساعدهم ذلك على قياس تقدم الأطفال مجتمعين 
وتحديد مقدار جودة أداء المدرسة في مساعدة الأطفال على التقدم للأمام. 

56 أرادت الإدارة التعليمية التنبؤ بالطلاب المحتمل تسربهم من التعليم» حتى 
يتمكنوا من مساعدتهم بشكل مسبق والعمل معهم عن قرب. yas‏ 5,51« تعاون 
مسؤولو الإدارة مع شركة مايكروس وفت (Microsoft)‏ لإنشاء نموذج بيانات يبرهن 
المفهوم ويستند على «Microsoft's Azure Machine Learning (ML)‏ وهو حل 
تحليلي تنبؤي يستند إلى المنصة السحابية التابعة لمايكروسوفت (Microsoft)‏ وقد 
قام هذ! النموذج بتحليل البيانات التي تم رفعها إلى Azure‏ من أنظمة معلومات 
متعددة على مباني الحرم الجامعي. وقام guae‏ بيانات Azure‏ بتمكين خط أنابيب 
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تنبؤي يستخدم نموذج Azure ML‏ للتنبؤ بتعرض الطالب لخطر التسرب. ويتم وضع 
النتائج التنبؤية من خلال قاعدة بيانات «Microsoft Azure SQL‏ بحيث يتمكن 
أعضاء طاقم العمل وأعضاء مجلس الإدارة التعليمية من مراجعة النتائج باستخدام 
لوحات معلومات .Power BI‏ وهكذا تمكنت الإدارة من رفع معدلات التخرج لمدارس 
تاكوما العامة من 00 في عام ١١٠١‏ إلى 481,7 في عام ۲١٠١‏ وذلك بمساعدة التحليلات 


-Microsoft Azure Machine Learnings التنبؤية‎ 





Sources:Blogs.technet.microsoft.com (2015). MLpredictsschool dropout risk &boosts 
graduation rates. https://blogs.technet.microsoft.com/machinelearning/201504/06// 
ml-predicts- school-dropout-risk-boosts-graduation-rates/(accessed August 2016); 
Customer.microsoft.com (2015). Tacoma Public Schools: Predicting student dropout 
risks, increasing graduation rates with cloud analytics. https://customers.microsoft. 
com/Pages/CustomerStory.aspx?recid-20703 (accessed August 2016); YouTube.com 
(2016). The saving power of data. https://www.youtube.com/watch? v-rfAoKs8XxzY 
(accessed August 2016). 


مركز Dartmouth-Hitchcock‏ الطبي يقدم dile JI‏ الصحية ا لمسبقة الشخصية 
باستخدام :Microsoft Cortana Analytics Suite‏ 

à»‏ & مركز Dartmouth-Hitchcock‏ الطبي (DHMO)‏ في لبنان» نيوهامبشاير. 
وهو المركز الطبي الأكادهي الوحيد في نيوهامبشاير وبه ما يقرب من ٤٠٠١‏ سرير. 
ويسعى هذا المركز أن تحدد بشكل مسبق صحة الأفراد المحتمل إصابتهم بالأمراض 
وبالتالي وقايتهم قبل الوقوع في فخ المرض. ويتمثل هدفهم في توفير الرعاية الصحية 
الشخصية بتكلفة أقل. فتقوم الممرضات والمدربون الصحيون بتتبع الحالة الصحية 
للمريض «Job sl‏ ويتم جمع البيانات باستخدام أجهزة استشعار مرفقة بأجهزة ضغط 
الدم وأجهزة قياس النبض وأجهزة تتبع النشاطات Microsoft Band Jis‏ . ويتم Jä‏ 
هذه البيانات إلى سحابة Azure‏ باستخدام الهواتف ASII‏ ثم يتم عرض البيانات 
على لوحات المعلومات التي تتم مراقبتها بشكل مستمر YE‏ ساعة في اليوم سبعة ell‏ 
à‏ الأسبوع بواسطة الممرضات المسجلات باستخدام Microsoft Cortana Analytics‏ 
Suite‏ وعندما تتخطى بيانات المريض حد السلامة» يتم تنبيه aUa a‏ الاق يقمن 
فورًا بالتواصل مع «ill‏ وبالتالي يتم تجنب المريض لخطر أي مشكلة خطيرة. وكنتيجة 
لاستخدام تقنية مايكروسوفت wda (Microsoft)‏ يمكن مراقبة صحة ال مريض عن asd‏ 
من منزل المريضء مما يساعد على تقليل تكلفة الزيارات المنتظمة للأطباء. 
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Sources: Blogs.microsoft.com (2015). Dartmouth-Hitchcock ushers in a new age 
of proactive, personalized healthcare using Cortana Analytics Suite. http://blogs. 
microsoft.com/transform/201513/07//dartmouth-hitchcock-ushers-in-a-new- age- 
of-proactive-personalized-healthcare-using-cortana-ana- lytics-suite/(accessed 
August 2016); Enterprise.microsoft.com. (2015). How Dartmouth-Hitchcock is 
challenging healthcares status quo with Cortana Analytics. https;//enterprise. 
microsoft. com/en-us/industries/health/how-dartmouth-hitchcock-is-chal- lenging- 
healthcares-status-quo-with-cortana-analytics/(accessed August 2016); YouTube. 
com. (2015). Dartmouth-Hitchcock revolutionizes the U.S. healthcare system. 
https://www.youtube.com/watch?v--wVeHZNn8aU (accessed August 2016). 


Mankind Pharma‏ تستخدم بنية السحابة التحتية IBM‏ لتقليص وقت تنفيذ 
التطبيق بنسبة AAA‏ 

تعتبر Mankind Pharma‏ شركة أدوية مقرها في نيودلهيء الهندء هي رابع أكبر منتج 
للوصفات الطبية المخدرة في الهند حيث يعمل بها ١١‏ ألف موظف وتبلغ إيراداتها ٠٠١‏ مليون 
دولار. ومع أعمالها ا متناميةء كانت Mankind Pharma‏ تبحث عن بيئة استضافة سحابية 
لتوفير بنية تحتية ممنصة الموارد البشرية (HR)‏ الخاصة بها وللمهمات الحساسة الأخرى. 

ds‏ سبيل ذلك شرع الفريق الفني بشركة Mankind‏ في استخدام منصة سحابة 
IBM‏ وتسمى Softlayer‏ والتي تحتوي على مراكز بيانات وخوادم فلزية معزولة في 
جميع أنحاء العامء مما يساعد Mankind‏ على القيام مهام أعمالها الحساسة على نطاق 
tle‏ وبالفعل انخفض وقت تنفيذ تطبيق الشركة بنسبة XIA‏ وذلك باستخدام خدمة 
البنية التحتية ل -Softlayer‏ والآن أصبح بإمكان العملاء الحصول على التطبيق في 
غضون ساعات بدلا من bos ١0‏ كما كان يحدث في السابق. 
Sources: IBM.com (2014). Softlayer hosting platform reduces application‏ 
implementation time by 987. http//www-03.ibm.com/software/businesscasestudies/‏ 
us/en/corp?synkey-Y979749150926G25 (accessed August 2016};  ClO.in.‏ 
Mankind Pharma finds an antidote in IBM solution for improving app‏ .)2015( 
implementation time (accessed August 2016). http;//www.cio.in/solution-center/‏ 
emc/55281; CxOtoday.com (2014). Cloud platform to help Pharma Co accelerate‏ 
growth. — http://www.cxotoday.com/story/mankind-pharma-to-drive-growth-with-‏ 


softlayers-cloud-platform/(accessed August 2016); Wikipedia.org.(n.d.). Mankind 
Pharma. https://en.wikipedia.org/wiki/Mankind Pharma (accessed August 2016); 
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Mankindpharma.com.  (n.d). Overview. — https://www.mankindpharma.com/ 


company/companyoverview (accessed August 2016). 

الخليج للطيران تستخدم البيانات الضخمة للحصول على رؤية أعمق للعملاء: 

تعتبر الخليج للطيران هي شركة النقل الوطني لدولة البحرين. وهي شركة 
طيران دولية رائدة يعمل بها «ba "٠٠١‏ وتخدم £0 مدينة في VE‏ دولة عبر Y‏ 
قارات. وهي رائدة في توفير الضيافة العربية التقليدية للعملاء. ولمعرفة المزيد عما 
يشعر به عملاؤهم بشأن خدمات ضيافتهم, تابعت الشركة ما يشاركه عملاؤهم على 
وسائل التواصل الاجتماعي في هذا الصدد. وكان التحدي هو تحليل جميع تعليقات 
ومنشورات العملاءء فقد كان هناك مئات الآلاف من المشاركات كل يوم. وتعتبر مراقبة 
هذه المشاركات يدويًا مهمة شاقة ومستهلكة للوقت كما ستكون عرضة للخطأ البشري. 

أرادت شركة الخليج للطيران جعل هذه المهمة وتحليل البيانات لمعرفة الاتجاهات 
السوقية حديثة الظهور تتم بصورة تلقائية. كما أرادت الشركة تأسيس بنية تحتية قوية 
لاستضافة مثل هذا Jal‏ لمراقبة وسائل التواصل الاجتماعي والتي ستكون متاحة على 
مدار الساعة وخفيفة الحركة عبر الحدود الجغرافية. 

طوّرت الخليج للطيران حلا لتحليل المشاعرء ”تحليل المشاعر العربية". والذي يحلل 
منشورات وسائل التواصل الاجتماعي الإنجليزية والعربية. وتستند أداة تحليل المشاعر 
العربية على توزيع bY Cloudera‏ عمل Hadoop‏ للبيانات الضخمة. وهي تعمل 
على بيئة السحابة الخاصة التابعة لشركة الخليج للطيران كما تستخدم منصة Red Hat‏ 
.JBoss Enterprise Application‏ تحمل هذه السحابة الخاصة حوالي 0١‏ تيرابايت 
من البيانات» ويمكن لأداة تحليل المشاعر العربية تحليل آلاف المنشورات على وسائل 
التواصل الاجتماعيء مما يوفر نتائج المشاعر في ظرف دقائق. 

وقد حققت شركة الخليج للطيران وفورات جوهرية في التكاليف من خلال وضع 
تطبيق ”تحليل المشاعر العربية“ على بيئة السحابة الخاصة الحالية للشركة حيث 
إنهم م يكونوا بحاجة لأن يستثمروا في إعداد البنية التحتية لنشر التطبيق. وتستعين 
الخليج للطيران blob‏ ”تحليل المشاعر العربية“ في تحديد العروض الترويجية لعملائها 
على أساس زمني وتساعدهم على الجلوس في مقدمة منافسيها. ولمواجهة öl‏ تعطل 
الخادم (ss LI‏ أنشأت الشركة ”صورًا شبحية“ للخادم هكن نشرها بسرعةء ويمكن أن 
تبدأ الصورة في لعب دور الخادم. ويقوم حل البيانات الضخمة بسرعة وكفاءة بالتقاط 





v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


المنشورات بشكل دوري وتحويلها إلى تقارير. مما يجعل شركة الخليج للطيران على دراية 
تامة بأي تغييرات في المشاعر أو تغيرات في الطلب» مما يمكنها من تقديم استجابة سريعة. 
فكان لأفكار حل البيانات الضخمة BÍ‏ إيجابيًا على أداء موظفي شركة الخليج للطيران. 

Sources: RedHat.com. (2016). Gulf Air builds private cloud for Big Data innovation 
with Red Hat Technologies. https://www.redhat.com/en/about/press-releases/ 
gulf-air-builds-private-cloud-Big-data-innovation-red-hat-technologies; (accessed 
August 2016); RedHat.com (2016). Gulf Air's Big Data innovation delivers deeper 
customer insight. https://www.redhat.com/en/success-stories(accessed August 
2016); ComputerWeekly.com. (2016). Big-data and open source cloud technology 
help Gulf Air pin down customer sen- timent. http://www.computerweekly.com/ 
news/450297404/Big- data-and-open-source-cloud-technology-help-Gulf-Air-pin- 


down- customer-sentiment (accessed August 2016).‏ 
Chime‏ تحسن تجربة العملاء باستخدام :Snowflake‏ 
يوفر Chime‏ وهوخيار (d pa‏ بطاقة ائتمان فی زاء وحساب FDIC‏ المؤمن للصرف 
والتوفيرء وتطبيق على الهاتف الجوال يسهل الخدمات المصرفية للأفراد. وأراد مسؤولو Chime‏ 
التعرف على مشاركات عملائه. كما أرادوا تحليل البيانات عبر المنصات الخاصة بهم للجؤالء 
والويب. والنهاية الخلفية لتحسين تجربة المستخدم. ومع «S‏ فقد كانت عملية سحب 
البيانات وتجميعها من مصادر متعددة مثل خدمات إعلانات Googles Facebook‏ والأحداث 
من الأدوات التحليلية الأخرى التابعة لطرف ثالث مثل «(JASON Object Notation) JSON‏ 
مهمة مرهقة. لقد سعوا للوصول إلى حل eai‏ من تجميع البيانات من هذه المصادر 
المتعددة وتحليل مجموعة البيانات. تقد كان Chime‏ بحاجة إلى حل يمكنه معالجة مصادر 
بيانات JSON‏ والاستعلام عنها باستخدام جداول قاعدة بيانات SQL‏ المعيارية. 


شرع Chime‏ في استخذام حل مستودع بيانات ‘Snowflake Elastic‏ ]5 قامت 





Snowflake‏ بسحب البيانات من جميع مصادر بيانات Chime‏ والبالغ عددها 
YE‏ مصدراء وقد شمل ذلك بيانات Jio‏ وثائق JSON‏ من التطبيقات. فقد عملت 
Snowflake‏ على مساعدة Chime‏ في Jules‏ بيانات JSON‏ بسرعة لتحسين خدمات 
الأعضاء وتقديم تجربة مصرفية أكثر خصوصية للعملاء. 

Source: Adapted from Snowflake.net. (n.d.). Chime delivers personalized customer 
experience using Chime. http://www.snow-flake.net/product (accessed August 2016). 
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إننا بصدد دخول nae"‏ البيتابايت"» وتبداً الأماليب التقليدية للبيانات والتحليلات في 
عرض حدودها. وتعتبر تحليلات السحابة حلا Das‏ حديث الظهور لتحليل البيانات على نطاق 
واسع. وتشتمل الأنظمة السحابية الموجهة بالبيانات على التخزين والحوسبة في بيئة موزعة 
وافتراضية. وتعتبر الليزة الأساسية oda]‏ العروض هي الانتشار السريع لأدوات التحليل اللتقدمة 
بين المستخدمينء دون استثمار معنوي في الاستحواذ على التقنية. غير أن هذه الحلول يصاحبها 
LA‏ العديد من التحديات» مثل الأمان ومستوى الخدمة والتحكم في البيانات. فقد اكتنف 
الحوسبة السحابية عدد من المخاوفء منها فقدان السيطرة والخصوصية: والمسؤوليات القانونية 
والقضايا السياسية عبر الحدود. وما إلى ذلك. ووفقًا لتحالف Cloud Security‏ فإن أخطر ثلاثة 
تهديدات أمنية في السحابة هي فقدان البيانات وتسر بهاء وتعطل الأجهزة والمعدات» والواجهة 
غير الآمنة. فجميع البيانات في السحابة يستطيع مقدم الخدمة الوصول إليهاء وبالتالي يمكنه 
أن يغير البيانات بشكل غير مقصود أو متعمد كما يمكنه تمرير البيانات إلى طرف ثالث لأغراض 
قانونية دون طلب من الشركة. ولا تزال البحوث محدودة في هذا الممجال. وكنتيجة UU‏ فهناك 
فرصة كبيرة لإدخال النمذجة التحليلية والحسابية والمفاهيمية إلى سياق علم nA]‏ وتوجيه 
الخدمة» والذكاء السحابي. ومع CUS‏ تعتبر الحوسبة السحابية مبادرة مهمة لمحترف التحليلات 
أن يشاهدها على أنها مجال سريع النمو. 
أسئلة مراجعة على القسم Y-A‏ 
-١‏ عرف الحوسبة السحابية. وكيف تتعلق ب PaaS‏ و5345 SIaaSg‏ 
-Y‏ أعط أمثلة لشركات تقدم الخدمات السحابية. 
*- كيف تؤثر الحوسبة السحابية على ذكاء الأعمال؟ 
-٤‏ كيف يقوم DaaS‏ بتغيير طريقة التعامل مع البيانات؟ 
0- ما هي الأنواع المختلفة للمنصات السحابية؟ 
1- اذا تعتبر AaaS‏ فعالة من حيث التكلفة؟ 
-V‏ اذكر على الأقل أسماء ثلاثة من كبار مقدمي الخدمات السحابية. 


8- أعط على الأقل ثلاثة أمثلة لقدمي خدمات -AaaS‏ 
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E-A‏ التحليلات القائمة على الموقع بالنسبة للمنظمات: 

لقد رأينا حتى الآنء العديد من الأمثلة على المنظمات التي تستخدم تقنيات تحليلية من 
أجل اكتساب نظرة ثاقبة في عملياتها الحالية من خلال تقديم المعلومات, والتحليلات التنبؤية, 
sis‏ وأساليب الأمثلية. وفي هذا القسم» سوف نتعرف على اتجاه GAL‏ بالغ الأهمية وهو 
دمج بيانات الموقع في التحليلات. ويُعطي الشكل (1-A)‏ تصنيفًا للتطبيقات التحليلية القائمة على 
الموقع. وسوف نقوم Vol‏ باستعراض التطبيقات التي تستفيد من بيانات الموقع الثابتة والتي 
bole‏ ما تُسمى بالبيانات الجغرافية ا مكانية. ومن 63 سنقوم بعد ذلك بفحص التطبيقات التي 
تستفيد من جميع بيانات الموقع الذي يتم إنشاؤه بواسطة أجهزة اليوم. ويركز هذا القسم Jof‏ 
على تطبيقات التحليلات التي تطورها المنظمات من أجل اتخاذ أفضل قرارات في إدارة العمليات» 
واستهداف العملاء والتقدم» وهكذاء ثم سنقوم أيضًا باستكشاف تطبيقات التحليلات التي يتم 
تطويرها ليستخدمها المستهلك بشكل مباشرء كما أن بعضها يستفيد أيضًا من بيانات الموقع. 











التحليلات القاتمة على dri‏ 
التوجه بالمستهلك التوجه بالمنظمة 
طريقة الموقع المتحرك ا Ja Ai‏ و طريقة المرقع المتحرك طريقة الجغرافيا المكاية AARD‏ 
تحایل تاريخى وحالى لطلب 5 نتاقج المرقع [EE‏ 
pre aoo‏ عدف 6 عروض تسويقية فحص مراقع الأماكن الجغرافية 
الشبكات الإجتماعية الصحية E‏ فى الوقت المناسب 


























شكل N-A‏ تصنيف تطبيقات التحليلات القائمة على الموقع 

التحليلات الجغرافية المكانية: 

Éole‏ ما يتم تمثيل رؤية موحدة للأداء العام للمنظمة من خلال أدوات التصوير dol‏ التي توفر 
معلومات قابلة للتطبيق. وقد تتضمن المعلومات القيم الحالية والقيم المتوقعة للعوامل التجارية 
ا مختلفة ومؤشرات الأداء الرئيسة (KPIS)‏ إن النظر في مؤشرات الأداء الرئيسة كأرقام إجمالية 
عبر كل من الرسوم البيانية وا مخططات المختلفة هكن أن يكون ساحقًا. وهناك خطر كبير يتعلق 
بفقدان فرص النمو المحتملة أو عدم تحديد مجالات الجدل. وتستخدم المنظمات الخرائط البصرية 
التي يتم تعيينها جغرافيًا والتي تعتمد على بيانات الموقع التقليدية» كبديل لمجرد عرض التقاريرء 
Soles‏ ما يتم تجميع هذه الخرائط البصرية بواسطة الرموز البريدية. وتعمل الأساليب التحليلية 
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القائمة على الموقع التقليدي والتي تس تخدم الترميز الجغرافي للمواقع التنظيمية والمستهلكين على 
عرقلة المنظمات عن فهم آثار «الموقع الحقيقي». وتقدم المواقع القائمة على الرموز البريدية عرضًا 
Leara‏ لمنطقة جغرافية كبيرة. وهذه الدقة المنخفضة قد لا تساعد في تحديد فرص gaill‏ داخل 
المنطقة. حيث هكن أن يتغير موقع العملاء المستهدفين بسرعة. وهكذاء فإن الحملات الترويجية 
الخاصة بالمنظمة قد لا تستهدف العملاء المناسبين إذا اعتمدت على الرموز البريدية. ولمعالجة 
هذه المخاوف. فإن المنظمات تضم الموقع والتوسعات المكانية للتحليلات )2010 (Gnau,‏ حيث 
إن إضافة مكونات الموقع التي تعتمد على السمات الطولية والعرضية للأساليب التحليلية التقليدية 
تكن المنظمات من إضافة بعد جديد يتعلق بالسؤال «أين» إلى تحليلات الأعمال التقليدية الخاصة 
بهم» والذي يُجيب حاليًا على الأسئلة التي تتعلق ب«من» و«ماذا» و«متى» و«ما مقدار». 

الجدير بالذكر أن البيانات التي تعتمد على اللوقع يمكن الحصول عليها الآن بسهولة من نظم 
المعلومات الجغرافية (GIS)‏ وهي 3 Xét‏ لرصد. وتخزينء وتحليل» lo] s‏ البيانات المرتبطة 
بموقع باستخدام تقنيات الاستشعار المتكاملةء والأنظمة العالمية لتحديد المواقع المثبتة في الهواتف 
ASII‏ أو من خلال نشر تقنية تحديد الهوية باستخدام موجات (RFID) j3 JI‏ في مجال البيع 
بالتجزئة وصناعات الرعاية الصحية. 


ومن خلال دمج المعلومات التي تدور حول الموقع مع بيانات الأعمال المهمة الأخرى تقوم 
ا منظمات عندئذ بإنشاء معلومات للمواقع )2010 (Krivda,‏ وتقوم ميزة ذكاء الموقع بتمكين 
المنظمات من اكتساب رؤى دقيقة واتخاذ قرارات أفضل من خلال تحسين YS‏ من العمليات 
والتطبيقات المهمة. وتعمل المنظمات الآن على إنشاء خرائط تفاعلية والتي من شأنها دعم التعمق 
في التفاصيل حول أي موقعء فضلًا عن أنها توفر للمحللين القدرة على البحث عن اتجاهات جديدة 
والربط بين العوامل الخاصة بالموقع عبر مؤشرات الأداء الرئيسة المتعددة -KPI‏ ويمكن للمحللين الآن 
تحديد الاتجاهات والأنماط بدقة في JS‏ من الإيرادات» والمبيعات» والربحية عبر المناطق الجغرافية. 

ومن خلال دمج التفاصيل الدهوغرافية داخل اللمواقع» يستطيع تجار التجزئة تحديد 
كيفية اختلاف المبيعات حسب مستوى السكان والقرب من المنافسين الآخرين؛ بالإضافة إلى 
أنهم يستطيعون تقييم الطلب وكفاءة عمليات سلس لة التوريد. كما تستطيع شركات المنتجات 
الاستهلاكية تحديد الاحتياجات الخاصة للعملاء ومواقع شكاوى العملاء وتتبعهم بسهولة وصولًا 
إلى المنتجات. ويمكن yout‏ المبيعات تحقيق أهدافهم البيعية من خلال تحليل جغرافيتهم. 

asi‏ شركة (esri.com) ESRI‏ هي الشركة الرائدة في السوق في توفير بيانات أنظمة المعلومات 
الجغرافية؛ حيث تقوم ESRI‏ بترخيص برنامج ArcGIS‏ الخاص بها SYY‏ العملاء ا في ذلك 
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التجاريون» والحكومة» والجيش. وقد يستغرق الأمر GLS‏ أو أكثر لتوضيح تطبيقات قاعدة بيانات 
أنظمة المعلومات الجغرافية لشركة ESRI‏ وبرامجها! وهناك شركة أخرى وهى grindgis.com‏ 
تحدد أكثر من ٠0‏ فئة من تطبيقات أنظمة المعلومات الجغرافي hitp://grindgis.com/.‏ 
dUssblog/gis-applications-uses) 5‏ بعض الأمثلة التي م نذكرها بعد وتشمل ما يلي: 
- التطبيقات الزراعية: فمن خلال الجمع بين كل من الموقع. والطقسء والتربة. والبيانات المرتبطة 
با محاصيلء يمكن التخطيط بدقة عالية لتطبيقات الري والأسمدة. وتتضمن الأمثلة على ذلك 
بعض الشركات مثل شركة sstsoftware.com‏ وشركة sensefly.com‏ (فكل منهما تجمع بين 
أنظمة المعلومات الجغرافية GIS‏ وأحدث المعلومات التي جُمِعَت من خلال طائرات بدون 
طيار وتقنيات أخرى ناشئة). 


- تحليل الجريمة: إن ربط بيانات الجريمة Le‏ في ذلك تاريخ الجريمة» ووقتهاء ونوعها مع بيانات 
نظمة المعلومات الجغرافية يوفر رؤى ثاقبة US‏ الجرهة وموظفي الشرطة. 
- التنبؤ بانتشار المرض: من أوائل أمثلة التحليلات الوصفية ال معروفة تحليل تفشي وباء الكوليرا 
في لندن عام Aot‏ خطط الدكتور John Snow‏ حالات الكوليرا على خريطة واستطاع دحض 
النظرية التي ترى أن تفشي وباء الكوليرا سببه سوء الهواء. فقد ساعدته الخريطة على أن يحدد 
بدقة أن سبب التفشي يرجع إلى jo‏ ماء سيئة. )2013 .(TheGuardian.com,‏ وقد قطعنا شوطًا 
كبيرًا من الحاجة إلى تخطيط الخرائط diga‏ غير أن الفكرة ا متعلقة بالقدرة على تتبع تفشي 
الأمراض ومن تم التنبؤ dap‏ مثل الأنفلونزاء باستخدام أنظمة المعلومات الجغرافية GIS‏ والبيانات 
الأخرى أصبحت مجالًا رائدًا في حد ذاته. وقد قدم الفصل السابع مثالا على استخدام بيانات 
وسائل التواصل الاجتماعي مع بيانات أنظمة المعلومات الجغرافية لتحديد اتجاهات الأنفلونزا. 
وبالإضافة إلى US‏ تستطيع المنظمات باستخدام ذكاء الموقع» أن تقوم بتغطية الطقس والآثار 
البيئية بشكل سريع وتوقع مستوى التأثير على عمليات الأعمال المهمة. ومع التقدم التقني» يتم 
الآن إدراج البيانات الجغرافية المكانية مباشرةً في مستودعات بيانات اممؤسسة» وتقوم تحليلات 
قاعدة البيانات التي تعتمد على الموقع بتمكين المنظمات من إجراء العمليات الحسابية المُعقدة 
بكفاءة عالية والحصول على رؤية واحدة لجميع البيانات الموجهة ÉS‏ وكشف الاتجاهات 
المختبئة والفرص الجديدة. Aiad‏ يدعم مستودع البيانات الخاص ب تيراداتا ميزة البيانات 
الجغرافية المكانية معتمدًا على اللعيار 501:/3434. ويتم رصد ميزة الجغرافيا المكانية كنوع 
بيانات هندسي جديد ST. GEOMETRY La ad‏ وهو يدعم مجموعة كبيرة من الأشكال من 
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blä‏ بسيطةء وخطوط وينحني إلى المضلعات المعقدة في تمثيل المناطق الجغرافيةء وهم يقومون 
بتحويل البيانات غير المتداخلة الخاصة gölge‏ أعمالهم التشغيلية من خلال دمج إحداثيات 
خطوط الطول والعرض. ويتم دعم هذه العملية الخاصة بالترميز الجغرافي بسهولة من قبل 
شركات الخدمات Jis‏ شركة NAVTEQ‏ وشركة Tele Atlas‏ والتي تحافظ على قواعد بيانات 
dde‏ للعناوين ذات الخصائص الجغرافية المكانية والاستفادة من أدوات تنظيف العناوين مثل 
-Trilliums Informatica‏ واللتان تدعمان رسم خرائط الإحداثيات المكانية للعناوين كجزء من 
وظائف الاستخراجء والتحويلء والتنزيل. 
وتقوم المنظمات عبر مجموعة متنوعة من قطاعات الأعمال باستخدام التحليلات الجغرافية 
المكانية. وسنقوم فيما يلي باستعراض بعض الأمثلة؛ حيث تقدم حالة عملية (£-A)‏ مثالا على LAS‏ 
استخدام المعلومات التي تستند إلى الموقع في اتخاذ قرارات اختيار الموقع في توسيع رقعة الشركة. 
وتوضح حالة عملية (0-A)‏ تطبيقًا آخر والذي يتجاوز مجرد قرار الموقع. 
حالة عملية t-A‏ 
Great Clips‏ تستخدم التحليلات ال مكانية لتوفير الوقت في قرارات الموقع 
يعد Great Clips‏ أكبر وأسرع صالونات الشعر في العام 452 وله أكثر من ٠٠٠٠١‏ فرع 
ما بين الولايات المتحدة الأمريكية وكندا. يعتمد نجاح Great Clips‏ في منح حق الامتياز 
للغير على إستراتيجية نمو قائمة على افتتاح فروع جديدة بشكل سريع في المواقع والأسواق 
المناسبة. كانت Great Clips‏ بحاجة إلى تحليل المواقع fl‏ على متطلبات قاعدة العملاء 
ال محتملة: والاتجاهات الدهموغرافية» وأثر المبيعات على حقوق الامتياز القائمة بالفعل 
في ا لموقع اللمستهدف. ومن الأهمية بمكان في هذا الصدد اختيار ا موقع الجيد. وقد 
استغرقت العمليات الحالية Ég‏ طويلًَا لتحليل موقع واحد وعدد هائل من العمالة 
يتطلب موارد تحليل مكثفة لتقييم البيانات بشكل يدوي من مصادر البيانات المتعددة. 
ومع آلاف المواقع التي يتم تحليلها في كل ele‏ كان التأخير ينذر بخطر خسارة 
المواقع الأولية لحساب المنافسين كما كان يبرهن على تكلفتها الباهظة؛ فاستعانت 
Great Clips‏ مقاولين خارجيين للتغلب على مشكلة التأخير. وقامت الشركة بإنشاء 
تطبيق سير عمل اختيار الموقع لتقييم أماكن الفروع الجديدة باستخدام الإمكانيات 
التحليلية للجغرافيا المكانية التابعة لشركة -Alteryx‏ وأي موقع جديد يتم تقييمه من 
خلال وقت القيادة التقريبية إليه وسهولة خدمة جميع العملاء الموجودين في محيط 
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شبكة .Great Clips‏ كما مكّن Jal‏ القائم على Alteryx‏ في تقييم كل موقع جديد Fla‏ 
على البيانات الدهوغرافية والسلوكية للمستهلكينء والتوافق مع ملفات تعريف عملاء 
Great Clips‏ الحاليين والآثر ا محتمل لإيرادات الموقع الجديد على المواقع الموجودة من 
قبل. وكنتيجة لاستخدام فنيات التحليل القائمة على الموقع. استطاعت Great Clips‏ 
تقليل وقت تقييم المواقع الجديدة بنسبة 70 تقريبًاء وتم إجراء التحليل ا مكثف 
للعمالة بصورة آلية وتم تطويره في تحليل جمع البيانات» ورسم الخرائطء وتطبيق إعداد 
التقارير التي يمكن استخدامها بسهولة من قبَل مديري العقارات غير الفنيين. بالإضافة 
إلى ذلك تمكنت الشركة من تنفيذ تحليلات تنبؤية مسبقة لأي موقع جديدء بحيث 
لا تستغرق العملية بأكملها OVI‏ سوى بضع دقائق. 

أسئلة للمناقشة: 

3Great Clips كيف يتم استخدام تحليلات الجغرافيا الممكانية في‎ -١ 


-Y‏ ما هي المعايير التي ينبغي على الشركة مراعاتها عند تقييم أماكن المواقع 
الجديدة في المستقبل؟ 
-Y‏ هل تستطيع التفكير في تطبيقات أخرى قد تستفيد من بيانات الجغرافيا المكانية؟ 
Source: Adapted from Alteryx.com. (n.d.). Great Clips. alteryx.com/sites/default/‏ 
files/resources/files/case-study-great-chips.pdf (accessed August 2016).‏ 
حالة عملية 0-4 
ستاربكس تستغل نظم المعلومات الجغرافية (GIS)‏ وتحليلاتها لتنمو في کل أنحاء العام 
يعتبر أحد أهم التحديات التي تواجه أي منظمة تسعى للتوسع هو تحديد موقع 
فرعها التاليء وهذا ما تواجهه ستاربكس. ولتحديد مواقع فروع جديدة. يقوم أكثر من 
٠‏ موظف في ستاربكس (يشار إليهم كشركاء) في ٠١‏ دولة باستخدام تخطيط السوق 
القائم على ArcGIS‏ وحل ذكاء الأعمال الذي يسمى 4]135؛ cuo‏ تمد Atlas‏ الشركاء 
مهام سير العمل والتحليل ومعلومات عن أداء الفرع بحيث هكن للشركاء المحليين في 
المجال اتخاذ القرارات عند تحديد فرص أعمال جديدة. 
وكما ذكرت تقارير مصادر متعددة. يستخدم صانعو القرار اطحليين Atlas‏ لفهم 
الاتجاهات السكانية والطلب. فيوجد في الصين s‏ أكثر من ١٠١‏ فرع ل ستاريكس» 
وتقوم الشركة بافتتاح فرع جديد كل يوم تقريبًا. dio‏ سبيل تحديد موقع الفرع التالي 
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تكون الشركة بحاجة لكثير من المعلومات عن المناطق التجارية وتجمعات بيع التجزئة 
وا مولدات والحركة المرورية والمعلومات الدهوغرافية. وبعد تحليل السوق والحي 
الجديدين. يستطيع المدير الحصول على نظرة مكبرة لمواقع محددة في أي منطقة في 
adl‏ ومن SS‏ تحديد ثلاثة أبراج مكتبية جديدة هكن أن تكتمل في غضون شهرين 
Mis‏ وبعد عرض هذه ا منطقة على الخريطة: هكن إنشاء نافذة لسير العمل والتي 
سوف تساعد المدير على متابعة حركة الموقع الجديد بد١ءًا‏ بالموافقة» مرورًا بالتصاريح, 
ثم التشييدء flo‏ الافتتاح. 


ويمكن أيضًا إدارة عمليات الطلب وسلاسل التوريد بشكل أفضلء وذلك من خلال 
تكامل بيانات الطقس مع البيانات المحلية الأخرى. وتسعى ستاربكس لتكامل أنظمة 
أعمالها مع حلول نظم (GIS)‏ الخاصة بها في خدمات الويب للحصول على رؤية جديدة 
للأعمال في جميع أنحاء العام. فمثلًاء تقوم ستاربكس بدمج توقع بيانات درجة الحرارة 
الحقيقية التي تتنبأ بها أرصاد. ويمكن أن تساعد هذه البيانات المتوقعة لدرجات 
الحرارة في تمركز الجهود التسويقية. ومع اقتراب الأسبوع شديد الحرارة في ممفيس» 
يمكن diak‏ ستاربكس اختيار مجموعة من بيوت القهوة والحصول على معلومات 
مفصلة عن blial‏ الطقس في الماضي وا مستقبلء بالإضافة إلى خصائص الفرع. ويمكن 
استخدام هذه ا معرفة لتصميم ترويج محلي لفرابتشينو «Mia .Frappuccinos‏ يمكن 
مساعدة ستاربكس على توقع ما سيطلبه عملاؤه لأسبوع مقدمًا. 

وللأحداث الكبيرة LÀ]‏ أثرٌ على بيوت القهوة. فعندما نزل ٠٠١‏ ألف شخص في 
موكب كبير في els San Diego‏ السقاة المحليون بخدمة الكثير من العملاء. ولضمان 
أفضل تجربة ممكنة للعميل» استخدمت ستاربكس هذه المعرفة بالحدث المحلي 
لتخطيط طاقم العمل وا مخزون في مواقع قريبة من املوكب. 

أسئلة للمناقشة: 


-١‏ ما هو نوع المعلومات الدهوغرافية ومعلومات GIS‏ التي قد تتعلق بقرار تحديد 
موقع الفرع؟ 

-Y‏ من المعلوم أن ستاربكس تشجع عملاءها على استخدام تطبيق الجوال الخاص 
lg‏ ما هو نوع المعلومات التي رها تلتقطها الشركة من التطبيق لمساعدتها في التخطيط 
الأفضل للعمليات؟ 
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-Y‏ هل إتاحة Wi-Fi‏ بالمجان في فروع ستاربكس ستقدم أي معلومات إلى ستاربكس 

من أجل تحليلات أفضل؟ 
Sources: Digit.HBS.org (2015). Starbucks: Brewing up a data storm! https://digit.hbs.‏ 
org/submission/Starbucks-brewing-up-a-data-storm/(accessed August 2016); Wheeler,‏ 
C. (2014). Going Big with GIS. http://www.esri.com/esri-news/arcwatch/0814/‏ 
going-Big-with-gis (accessed August 2016); Blogs.ESRLcom. From customers to‏ 
CxOs, Starbucks delivers world-class service. (2014). https//blogs.esri.com/esri/‏ 
ucinsider/201429/07//Starbucks/(accessed August 2016).‏ 


وبالإضافة إلى تطبيقات تحليل معاملات التجزئة التي أبرزناها هناء فهناك تطبيقات أخرى 
متعددة للجمع بين المعلومات الجغرافية وبين البيانات الأخرى التي يتم إنشاؤها من قبل المنظمة. 
فعلى سبيل JEL‏ غالبًا ما تنتج عمليات الشبكة وشركات الاتصالات كميات هائلة من البيانات 
اليوم. وتسطيع القدرة على تحليل البيانات بسرعة مع مستوى Jle‏ من التفاصيل الخاصة با موقع 
أن تحدد بشكل أفضل الاضطراب عند العميل ومن ثم تقوم با مساعدة في صياغة إستراتيجيات 
خاصة بالمواقع من أجل زيادة كل من الكفاءة التشغيليةء وجودة الخدمة» والأرباح. 

ويستطيع التحليل الجغرافي المكاني أن o‏ شركات الاتصالات من رصد المعاملات اليومية من 
الشبكة لتحديد المناطق الجغرافية التي تعاني من فشل عدد كبير من محاولات الاتصال الخاصة 
بالصوت» أو البيانات» أو النص» أو الإنترنت. وتستطيع التحليلات أن تساعد في تحديد الأسباب 
الدقيقة اعتمادًا على الموقع والانتقال إلى عميل فردي من أجل توفير خدمة Mas‏ أفضل. ويمكنك 
أن تلمس ذلك أثناء العمل عن طريق إكمال تمرين الوسائط المتعددة التالي. 
تمرين الوسائط المتعددة في تحليلات تستخدم التحليلات الجغرافية المكانية: 

تشتمل شبكة جامعة تيراداتاعلى فيديو BSI‏ في حالة فشل مكاممات الهاتف المحمول. يُرجى مشاهدة 
الفيديو المتاح على موقع يوتيوب عبر الرابط التالي: http://www.teradatauniversitynetwork.‏ 
-com/Library/Items/BSI- The-Case-of-the-Dropped-Mobile-Calls./‏ 

وتطلق شركة اتصالات خطًا جديدً! من الهواتف الذكية وتواجه مشاكل مع انخفاض ال مكاممات. 
وتتعرض عملية الطرح الجديد إلى مشاكلء وتعتبر المنطقة الشمالية الشرقية هي المنطقة الأكثر 
تضررًا حيث يقومون ale‏ تأثيرات المكالمات المفقودة على أرباح المنطقة الجغرافية. وتقوم 
الشركة بإيجار BSI‏ لتحليل المشاكل الناجمة عن عيوب الهواتف ASI‏ وتغطية البرج» ومواطن 
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خلل البرمجيات. وتنقسم بيانات المنطقة الشمالية الشرقية بأكملها إلى مجموعات جغرافية 
وتقوم الشركة بحل ا مشكلة من خلال تحديد بيانات العملاء الفردية. ويستخدم فريق BSI‏ 
التحليلات الجغرافية المكانية لتحديد المواقع التي تؤدي فيها تغطية الشبكة إلى انخفاض SUKI‏ 
وتقترح تثبيت بضعة أبراج إضافية في موقع العملاء غير الراضين عن الخدمة. 
وبعد اكتمال الفيديوء يمكنك الاطلاع على كيفية إعداد التحليل عبر: 
slideshare.net/Teradata/bsi- Teradata-the-case-of-the-dropped-mobile-calls.‏ 


وتقدم هذه النزهة من الوسائل المتعددة مثالا على مجموعة من التحليلات الجغرافية المكانية 
بجانب تحليلات البيانات الضخمة التي تساعد في اتخاذ القرارات بشكل أفضل. 


ذكاء الموقع الفوري: 


تقوم العديد من الأجهزة المستخدمة بواسطة المستهلكين والمهنيين بإرسال معلومات الموقع 
الخاصة بهم بوتيرة ثابتة. وتقوم السيارات والحافلات وسيارات الأجرة وأجهزة الجوال والكاميرات 
وأجهزة التنقل الشخصية ببث إشارات مواقعها باستخدام تقنيات تحديد المواقع المتصلة بالشبكة 
مثل -cell tower triangulation Wi-Fis (GPS)‏ 

ويستخدم الملايين من المستهلكين وأصحاب الأعمال الأجهزة الممكنة بالموقع للعثور على خدمات 
قريبةء وموقع الأصدقاء والعائلة. والتنقلء وتعقب الأصول والحيوانات aS‏ والاشتراك في الألعاب 
الرياضية: والهوايات. وقد أدى هذا الاندفاع القوي في الخدمات الممكنة بالموقع إلى قاعدة بيانات 
ضخمة من المعلومات التاريخية ومعلومات الموقع المتدفقة أولًا «Job‏ وهي بالتأكيد متفرقة وغير 
مفيدة في حد ذاتها. حيث تقدم مجموعة البيانات الآلية التي تم تمكينها من خلال التقاط الهواتف 
الخلوية ونقاط الوصول الساخنة إلى Vos Wi-Fi‏ جديدًا fta‏ للاهتمام في أبحاث السوق غير 
المتداخلة, وجمع البيانات» وبالطبع؛ التحليل الدقيق Jib‏ هذه المجموعات الضخمة من البيانات. 

ويمكن من خلال التحليل والتعلم من هذه الأنماط واسعة النطاق d Sx‏ أن يتم تحديد 
فئات متميزة من السلوكيات في سياقات محددة. ويسمح هذا النهج لأصحاب الأعمال بفهم أنماط 
عملائهم بشكل أفضل واتخاذ قرارات أقوى بشأن العروض الترويجية والتسعير وما إلى ذلك. كما 
يمكن من خلال تطبيق الخوارزميات التي تقلل من أبعاد بيانات الموقع» أن يتم تمييز الأماكن وفقًا 
للنشاط والتنقل بينها. ومن الكميات الهائلة لبيانات الموقع ذات الأبعاد المرتفعةء تكشف هذه 
الخوارزميات عن اتجاهات ومعانِ وعلاقات تنتج في النهاية تمثيلات سهلة الفهم للبشر ثم يصبح 
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بعد ذلك من الممكن استخدام مثل هذه البيانات لعمل تنبؤات ذكية تلقائيًا وإيجاد أوجه تطابق 
وتشابه مهمة بين الأماكن والأفراد. ويظهر تطبيق التحليلات القائمة على الموقع في تطبيقات 
التسويق الموجهة بالمستهلك. وقد قام Quiznos‏ وهومطعم خدمات سريعة: باستخدام منصة 
Sense Networks‏ لتحليل مسارات المواقع لمستخدمي الجوال بناءً على البيانات الجغرافية المكانية 
المتحصل عليها من نظام (GPS)‏ والعملاء المستهدفين من الذكاء التقني باستخدام الكوبونات. 
انظر حالة عملية (1-۸). توضح هذه الحالة الاتجاه الحديث في مجال بيع التجزئة حيث تتطلع 
الشركات إلى رفع كفاءة الحملات التسويقيةء ليس فقط من خلال استهداف كل عميل بناءً على 
موقعه «lodi‏ ولكن عن طريق استخدام تحليلات تنبؤية AST‏ تطورًا في الوقت المناسب على 
خصائص المستهلكين السلوكية لإيجاد المجموعة الصحيحة من المستهلكين للحملات الإعلانية. 
حالة عملية 5-8 
مطعم Quiznos‏ يستهدف عملاء للسندويشات التي يقدمها 
قام مطعم Quiznos‏ الحاصل على حق امتياز للخدمة السريعة» بتنفيذ حملة 
استهداف أجهزة الجوال القائمة على الموقع والتي استهدفت مستهلكين ذوي دهاء تقني 
وغير متفرغين من مدينة بورتلاند. بولاية أوريجون. واستخدمت الحملة منصة Sense‏ 
Networks‏ والتي قامت بتحليل مسارات مواقع مستخدمي الجوال لفترات زمنية مفضلة. 
وقامت بإنشاء ملفات شخصية مجهولة SU‏ على السمات السلوكية لعادات التسوق. 
وبتطبيق التحليلات التنبؤية على الملفات الشخصية للمستخدمينء قام مطعم 
5 باستخدام الاستهداف السلوقي المبني على الموقع لتقليل خصائص المستخدمين 
المحتمل تناولهم للأكل في مطعم الخدمة السريعة أكثر من غيرهم. واستمرت هذه 
الحملة الإعلانية لمدة شهرين - نوفمير وديس مبر 7١17‏ - واستهدفت فقط العملاء 
الذين تتراوح أعمارهم بين Gle ١6و VA‏ والمحتمل تواجدهم في مطاعم الخدمة السريعة 
خلال الثلاثين Gas‏ السابقة» في حدود ٠١‏ ميلًا مربعًا تقريبًا حول مطعم -Quiznos‏ 
واستخدمت إعلانات الجوال ذات الصلة بالكوبونات المحلية flu‏ على موقع العميل. 
وقد نتج عن هذه الحملة أكثر من VV‏ مليون عميل جديد وزيادة بنسبة ×۲١‏ في 
عمليات استرداد الكوبونات داخل منطقة بورتلاند. 
أسئلة للمناقشة: 


-١‏ كيف يكن أن تساعد التحليلات القائمة على الموقع تجار التجزئة في استهداف العملاء؟ 
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-Y‏ قم بالبحث عن تطبيقات مشابهة للتحليلات قائمة على ال موقع في مجال بيع التجزئة. 
Source: Adapted from Mobilemarketer.com (2013). Quiznos sees 20pc boost in‏ 


coupon redemption via location-based mobile ad campaign. mobilemarketer.com/ 


cms/news/advertising/14738.html (accessed August 2016). 

ولا زال هناك امتداد آخر للتحليلات القائمة على الموقع وهو استخدام الواقع المعزز. في 
عام Y VV‏ ظهرت ضجة سوقية اسمها Pokémon GO‏ وهي لعبة قائمة على الواقع معززة 
باستشعار الموقع حيث تشجع المستخدمين على AJUSM‏ بأشياء افتراضية من المواقع الجغرافية 
المنتقاة. فيستطيع المستخدم أن يبدأ من أي مكان في المدينة ويسير وفقًا لعلامات على التطبيق 
للوصول إلى بند معين. وتكون الأشياء الافتراضية مرئية من خلال التطبيق عندما يوجه ا مستخدم 
كاميرا الهاتف باتجاه أي منهاء ويستطيع المستخدم بعد ذلك أن يطالب بذلك الشيء. وتعد 
تطبيقات الأعمال Jit‏ هذه التقنيات Lái‏ حديثة الظهور. على سبيل «JULI‏ يوجد تطبيق يسمى 
Candybar‏ يسمح هذا التطبيق لأصحاب الأعمال بوضع هذه الأشياء الافتراضية على خريطة 
باستخدام خرائط Google‏ كما يمكن باستخدام Google Street View‏ تحديد مواقع تلك 
الأشياء بمزيد من الدقة» وبمجرد أن يتم تنسيق كل البنود الافتراضية مع المعلومات وا موقع» يصبح 
بإمكان صاحب العمل أن يبث بنودًا مرئية للمستخدم بشكل فوري. كما يوفر Candybar‏ أيضًا 
تحليلات استخدام الأعمال لتمكين استهداف أفضل للأشياء الافتراضية. ويعمل جانب الواقع 
الافتراضي لهذا التطبيق على تحسين تجربة المستخدمين, بتوفير بيئة ”ألعاب“ لهم في الحياة 
الواقعية. وفي نفس الوقت» يوفر منصة تسويق قوية لأصحاب الأعمال للوصول إلى عملائهم. 

وكما هو واضح من هذا القسم» فقد تصبح التحليلات القانئمة على الموقع والتطبيقات الناتجة 
عنها هي أهم واجهة للمنظمات في المستقبل القريب. وكان استخدام البيانات التشغيلية أو 
التسويقية من قبل المنظمات واحدًا من الأفكار الشائعة في هذا القسم. وسوف نقوم لاحقًا 
باستكشاف تطبيقات التحليلات التي تستهدف المستخدمين بشكل مباشر وفي بعض الأحيان 
تستغل ميزة معلومات الموقع. 


لقد أوجد النمو الهائل في صناعة التطبيقات لمنصات الهواتف الذكية Androids iOS)‏ 
Windows s‏ وما تبعها) وفي استخدام التحليلات فرصًا كبيرة لتطوير التطبيقات حيث يستخدم 
المستهلكون التحليلات دون إدراك. وتختلف هذه التطبيقات عن الفئة السابقة في أنها معنية 
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بالاستخدام المباشر للمستهلكء بدلا من المنظمة التي تحاول التنقيب في بيانات المستخدم المتعلقة 
بالاستخدام / بالشراء لإنشاء ملف تعريف لتسويق منتجات أو خدمات محددة. ووفقًا للتنبؤات» 
تعمد هذه التطبيقات إلى تمكين المستهلكين من اتخاذ قرارات أفضل عن طريق استخدام تحليلات 
محددة. ونستعرض فيما يلي مثالين على ذلك. 

يعمل Waze‏ - وهو تطبيق ويب اجتماعي - على مساعدة المستخدمين في تحديد مسار 
التنقل وتنبيه المستخدمين بالمشكلات المحتملة Jis‏ الحوادث ونقاط التفتيش وأجهزة مراقبة 
السرعة ومواقع أعمال البناء على الطريق» وذلك Eli‏ على مدخلات مستخدمين آخرين. وقد 
أصبح Waze‏ أحد أكثر تطبيقات التنقل انتشارًا. وقد حصلت Google‏ على هذا التطبيق منذ 
بضع سنوات» وعملت على تحسينه. ويعد هذا التطبيق مثالا على تجميع المعلومات التي ينشئها 
ا مستخدم وجعلها متاحة للعملاء. 

تسمح الكثير من التطبيقات للمستخدمين بإرسال الاستعراضات والتصنيفات لأصحاب الأعمال 
والمنتجات وما إلى ذلك ومن 63 تقدهها للمستخدمين في صورة متكاملة مساعدتهم في وضع خيارات. 
ويمكن تعريف هذه التطبيقات Lf‏ كتطبيقات مبنية على بيانات اجتماعية تستهدف المستهلكين 
حيث يقومون بإنشاء البيانات. ويعتبر Yelp‏ أحد التطبيقات الأكثر رواجًا بين تطبيقات الفئة. 

وتم نشر تطبيق آخر مرتبط بالنقل يستخدم التحليلات التنبؤية في بيتس بيرج بنسلفانيا. وقد 
تم تطويره بالتعاون مع جامعة «Carnegie Mellon‏ ويشمل هذا التطبيق إمكانيات تنبؤية لتقدير 
توافر مواقف السيارات. ويقوم ParkPGH‏ بتوجيه السائقين إلى المناطق التي تتوفر فيها مواقف 
للسيارات. فهو يقوم بحساب عدد أماكن وقوف السيارات المتاحة في ٠١‏ مواقف والتي تتجاوز 01٠٠١‏ 
مساحة و٥۲‏ من مواقف السيارات في وسط مدينة بيتس بيرج. ويتم تحديث المساحات المتاحة 
كل ٠١‏ ثانية» مما يحفظ تواجد السائق بالقرب من الأماكن المتاحة قدر الإمكان. وبالاعتماد على 
الطلب التاريخي والأحداث الحاليةء يكون التطبيق قادرًا على التنبؤ بتوفر مواقف للسيارات adsis‏ 
معلومات عن المساحة التي ستكون متاحة مع الوقت الذي يصل فيه السائق إلى المكان المقصود. 
وتستخدم الخوارزمية الأماسية للتطبيق بيانات حول الأحداث الجارية حول المنطقة - على سبيل 
ا مثالء لعبة كرة السلة - للتنبؤ بزيادة في الطلب على أماكن وقوف السيارات في وقت لاحق من ذلك 
cesa‏ وبالتالي توفير وقت ثمين للمسافرين للبحث عن أماكن وقوف السيارات في المدينة المشغولة. 

لم تكن نشأة التطبيقات القائمة على التحليلات فقط للمرح والصحةء ولكنها ظهرت كذلك 
لتعزيز إنتاجية الفرد. فعلى سبيل «JUL‏ تتواجد التطبيقات 1026© و0134 وغيرها في مكان 
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واحد. ويقوم تطبيق Cloze‏ بإدارة صناديق الرسائل الواردة للعديد من حسابات البريد 
الإلكتروني بجانب حسابات أخرى لوسائل التواصل الاجتماعي. فهو يقوم بعمل تكامل بين 
الشبكات الاجتماعية وجهات اتصال البريد الإلكتروني لمعرفة أي من جهات الاتصال تكون أكثر 
أهمية من غيرها ويقوم بإعطائها درجات» بحيث تحصل جهات الاتصال المهمة علي درجة أعلى. 
فيتم عرض رسائل البريد الإلكتروني ذات الدرجات الأعلى Sof‏ وبالتالي يقوم بإبعاد البريد الأقل 
أهمية وغير ذي الصلة. ويعمل 01026 على تخزين سياق كل محادثة لتوفير الوقت عند العودة 
لمكالمة معلقة. ويتم تنظيم جهات الاتصال في مجموعات tls‏ على عدد مرات تكرار تفاعلهاء مما 
يساعد المستخدمين على البقاء على اتصال مع الأفراد الذين قد يفقدون الاتصال بهم. ويمكن 
للمستخدمين وضع درجات 01026 للأفراد الذين يريدون الحصول على اتصال بهم والعمل على 
تحسين هذه الدرجة. ويقوم Cloze‏ برفع درجة كلما حدثت محاولة اتصال. فعلى سبيل المثال» 
عند فتح أي بريد إلكتروني يوفر 01026 عدة خيارات» مثل SI"‏ ”اليوم“ Ie"‏ ”الأسبوع 
القادم“ والتي KI‏ المستخدم تلقائيًا أن يبدأ الاتصال وفقًا للجدول الزمني. ويعمل هذا كتذكير 
للرجوع إلى رسائل البريد الإلكتروني في وقت لاحق» دون نسيانها أو وضع علامة ”غير مقروء“عليهاء 
والتي غالبًا ما تؤدي إلى ازدحام صندوق الوارد. ولأن 01026 GII‏ أصبح مستهدقًا كتطبيق إنتاجي 
للأعمالء تعتبر أسعاره حاليًا أكبر من إمكانيات المستهلك. 

وكما يتضح من هذه الأمثلة للتطبيقات المرتكزة على المستهلك. تبدأ التحليلات التنبؤية 
في تمكين تطوير البرمجيات التي يستخدمها المستهلك مباشرة. وتقدّر مجلة Wall Street‏ 
(wsj.com/apps)‏ حجم صناعة التطبيقات الذي وصل بالفعل لقيمة YO‏ مليار دولار بنمو 
متوقع أكبر. ونحن نؤمن Ob‏ نمو التطبيقات التحليلية الموجهة با مستهلك سيستمر ويصنع 
الكثير من فرص الأعمال الحرّة لقراء هذا الكتاب. 

ويتمثل أحد أهم المخاوف من استخدام هذه التقنيات في فقدان الخصوصية. فإذا استطاع 
أي شخص تنبع حركة انتقال الهاتف الخلويء تكون خصوصية هذا العميل مشكلة كبيرة؛ إذ يدعي 
بعض مطوري التطبيقات أنهم بحاجة فقط إلى جمع معلومات تدفق مجمعةء وليس المعلومات 
سهلة التحديد بشكل فرديء في حين تظهر الكثير من القصص في وسائل الإعلام تسلط الضوء على 
اختراقات لهذا المبدأ العام. ويجب أن يكون لدى كل من المستخدمين والمطورين لهذه التطبيقات 
الوعي التام بالأثر الضار الناجم عن منح معلومات خاصة فضلًا عن جمع dia‏ هذه المعلومات. 
وفي القسم التالي سوف نناقش هذه القضية بشيء من التفصيل. 
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أسئلة مراجعة على القسم 6-8: 
-١‏ كيف تستخدم التحليلات التقليدية البيانات القائمة على الموقع؟ 
-Y‏ كيف هكن أن تساعد المواقع المكودة جغرافيًا في اتخاذ قرار أفضل؟ 
-Y‏ ما هي القيمة المضافة بواسطة التحليلات الجغرافية المكانية؟ 
-٤‏ قم باستكشاف استخدام التحليلات الجغرافية المكانية بشكل أكبر من خلال التحقق من 
استخدامها عبر قطاعات متنوعة مثل تتبع التعداد الحكوميء والتسويق للمستهلك؛ وما إلى ذلك. 
0- قم بالبحث على الإنترنت عن تطبيقات أخرى للتطبيقات التحليلية الموجهة با مستهلك. 
1- كيف ose‏ للتحليلات القائمة على الموقع أن تساعد المستهلكين الأفراد؟ 
-V‏ قم باستكشاف المزيد من تطبيقات النقل التي قد تستخدم تحليلات قائمة على الموقع. 
-A‏ ما هي التطبيقات الأخرى التي يمكنك تخيلها إذا كنت قادرًا على الوصول إلى بيانات موقع الهاتف الخلوي؟ 
0-8 القضايا القانونية» والخصوصية. والأخلاقية: 
لقد تطورت تطبيقات ele‏ البيانات» والتحليلات» والحوس بة الإدراكية: بالإضافة إلى الذكاء 
الاصطناعي في إمكانية الوصول إليها وانتشارهاء وقد أدى هذا التطور إلى تأثر كل شخص بهذه 
التطبيقات. ومجرد إمكانية تحقيق شيء من خلال التقنية» لا تجعله شيئًا E utis‏ أو قانونيًه أو 
أخلاقيًا. ويجب أن يكون متخصصو ele‏ البيانات والمديرون على وعي تام بهذه المخاوف. وترتبط 
العديد من القضايا القانونيةء والخصوصية. والأخلاقية المهمة بالتحليلات. ونقدم هنا أمثلة معبرة 
ومصادر فقط. oleg‏ ما تكون وسائل الإعلام المنتشرة حريصة للغاية على الإبلاغ عن Jia‏ هذه 
الانتهاكات للسلوك القانوني والأخلاقي. لذلك؛ فإن هذا القتسم هو أحد الأقسام الذي قد يمكنك 
العثور فيه على المزيد من الأمثلة الحديثة عبر الإنترنت. وكما أشرنا في الفصل الأول» فإننا نهدف 
هنا فقط لإطلاعك على هذه القضايا. وينبغي على فرّق الفصل الخاص بك أن تحدد حالات 
أحدث وتقوم بمناقشة هذه الحالات. 
القضايا القانونية: 
قد يؤدي إدخال التحليلات إلى تفاقم مجموعة كبيرة من القضايا القانونية التي لها صلة فعلية 
بأنظمة الحاسب. وعلى سبيل JELI‏ فإن الأسئلة المتعلقة با مسؤولية عن أعمال المشورة المقدمة 
من الآلات الذكية بدأت تؤخذ بعين الاعتبار. 
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وبالإضافة إلى حل النزاعات حول نتائج بعض التحليلات غير المتوقعة بل Leag‏ الضارة فإنه 
قد تظهر قضايا أخرى معقدةء مثل: من الذي يتحمل المسؤولية في حالة ما إذا وجدت اللؤسسة 
نفسها مفلسة نتيجة لاستخدام نصيحة تطبيق تحليلي؟ هل ستتحمل المؤسسة المسؤولية لعدم 
اختبار النظام بشكل كاف قبل إسناد قضايا حساسة له؟ هل ستشارك شركات التدقيق والمحاسبة 
في المسؤولية عن الفشل في تطبيق اختبارات تدقيق كافية؟ هل سيكون لمطوري البرمجيات 
الخاصة بالأنظمة الذكية دور في المسؤولية؟ عندما تصبح السيارات ذاتية القيادة أكثر Haah‏ 
من سيكون المسؤول عن أي ضرر أو تلف عندما تتعطل أجهزة استشعار السيارة أو الشبكة أو 
التحليلات في العمل كما هو مُخطط لها؟ وهناك حالة حديثة gles‏ بحادث سيارة Tesla‏ حيث 
مات السائق بينما أظهرت السيارة أنها في وضع الطيار «autopilot» JYI‏ وقد تقلت هذه القضية 
على الصفحات الأولى من AAA‏ وال مهن القانونية. 
وقدمت الحالة العملية (V-V)‏ أمثلة على استخدام البيانات البديلة في استخدام معلومات 
إضافية من أجل توقعات صائبة بشأن مخرجات الحصيلة المستقبلية» ومبيعات الشركة وغيرها. 
وعلى الرغم من أن هذه الأدوات اليوم لا تفرض 55,8[ تقليدية على التداول من الداخل نظرًا 
لعدم مشاركة أي شخص داخل الشركة للمعلومات غير العامة إلا أنه رها لا تزال هناك مشاكل 
حول الحصول على المعلومات التي تكون غير متاحة للعامة. وقد لاحظ Ekster‏ (2015) أن أي 
تاجر في السوق يستخدم التحليلات والبيانات البديلة LY‏ أن يكون على ele‏ بقواعد المعلومات 
المفروضة من قبل الهيئات التنظيمية المالية. وعادةً ما تكون الأفكار المستمدة من البيانات 
العامة آمنة نظرًا لعدم الحصول عليها بشكل مباشر من مصادر داخلية. 
تأمل المسائل القانونية المُحددة التالية: 
- ما قيمة رأي الخبير في المجال إذا ما تم تشغير الخبرة في الحاسب؟ 
- من هو المسؤول عن النصيحة (أو المعلومات) الخاطئة التي يقدمها أحد التطبيقات الذكية؟ 
فمثلاء ماذا يحدث إذا صدق الطبيب تشخيصًا غير صحيح Laki‏ جهاز الحاسب pls‏ الطبيب 
على أساسه باتخاذ إجراء تسبب في وفاة أحد المرضى؟ 
- ماذا يحدث لو قام أحد ا مديرين بإدخال تقييم حكمي غير صحيح في تطبيق تحليلي وكانت 
النتيجة حدوث ضرر أو كارثة؟ 


- من الذي هلك المعرفة في قاعدة المعرفة؟ 
- هل تملك الإدارة الحق في إجبار الخبراء على المساهمة بخبراتهم؟ 
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الخصوصية: 

يختلف مفهوم الخصوصية باختلاف الناس. وبشكل ele‏ فإن الخصوصية هي حقك في أن تنفرد 
cello‏ كما أنها الحق في أن تتحرر من تدخلات الآخرين غير المعقولة في أمورك الشخصية. ولطاما 
كانت الخصوصية قضية قانونية» وأخلاقيةء واجتماعية في العديد من البلدان» حيث يتم الاعتراف 
بالحق في الخصوصية اليوم في كل ولاية من الولايات المتحدة الأمريكية والحكومة الفيدرالية سواء 
أكان من خلال التشريع» أو بموجب القانون العام. ويمكن تفسير تعريف الخصوصية تفس واسعًا 
die‏ بيد أن المحكمة كانت تتبع في قراراتها السابقة القاعدتين التاليتين بشكل دقيق إلى حد da‏ وهما: 
-١‏ أن حق الخصوصية ليس > مطلقًا. فالخصوصية يجب أن تكون متوازنة مع احتياجات المجتمع. 
-Y‏ أن حق الجمهور في المعرفة يفوق حق الفرد في الخصوصية. 

وتوضح هاتان القاعدتان سبب صعوبة تحديد وتطبيق قوانين الخصوصية في بعض الأحيان 
(انظر 2005 (Peslak,‏ وتتضمن قضايا الخصوصية عبر الإنترنت خصائص وسياسات محددة. 
وفيما يلي سنناقش أحد المجالات الذي قد تتعرض فيه الخصوصية للخطر. وللتعرف على قضايا 
الخصوصية والأمان في بيئة مستودع البيانات» يمكنك أيضًا الاطلاع على الورقة التي كتبها كل من 
LeClercs Elson‏ (2005). 


جمع المعلومات عن الأفراد: 


في كثير من الحالات كان التعقيد في عملية gaz‏ المعلومات» وفرزهاء وحفظهاء والوصول إليها 
Loo‏ في العديد من الوكالات الحكوميةء بمثابة وقاية تلقائية ضد إساءة استخدام المعلومات 
الخاصة.. فقد كان الإقدام على انتهاك خصوصية أي شخص ببساطة أمرًا مكلقًاه ومرهقًاء فضلا عن 
كونه معقدًا. وقد أنشأ الإنترنت To‏ جديدًا GU‏ للوصول إلى البيانات واستخدامهاء io‏ إلى جنب 
مع قواعد البيانات واسعة النطاق. ويمكن استخدام القوة الكامنة في الأنظمة التي يمكنها الوصول 
إلى كميات هائلة من البيانات لأجل مصلحة المجتمع. Dad‏ من خلال مطابقة السجلات مساعدة 
جهاز الحاسب» يمكن القضاء على أو الحد من الاحتيال والجرهة وسوء الإدارة الحكومية والتهرب 
الضريبي والغش في الرعاية الاجتماعية وسرقة الدعم الأسري وتوظيف العمال غير الشرعيين» وغير 
ذلك. ولكن ما هو القدر الذي يجب أن يتكلفه الفرد من فقدان الخصوصية بحيث تستطيع 
الحكومة إلقاء القبض على المجرمين بشكل أفضل؟ وينطبق الأمر ذاته على مستوى الشركات. 
فعلى الرغم من أن المعلومات الخاصة بالموظفين قد تساعد في اتخاذ القرارات بشكل أفضلء إلا أن 
خصوصية الموظفين قد تتأثر بهذا الأمر. وهناك قضايا مشابهة تتعلق بالمعلومات الخاصة بالعملاء. 
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الجدير بالذكر أن الآثار المترتبة على الخصوصية على شبكة الإنترنت لا يُستهان بها. ويوسع 
القانون الوطني الأمريي أيضًا من قدرة الحكومة على الوصول إلى معلومات الطالب والمعلومات 
المالية الشخصية دون أي شبهة في ارتكاب مخالفات» وذلك عبر إثبات أن تلك المعلومات التي 
من المرجح الحصول عليها لها صلة بالتحقيق الجناثي الجاري (انظر مركز معلومات الخصوصية 
الإلكترونية, 0« (Y+‏ فقد تم استخدام معلومات الموقع من الأجهزة لتحديد مكان الضحايا وكذلك 
الجناة في بعض الحالات» ولكن إلى أي حد تكون المعلومات ليست Ils‏ للفرد؟ وقد جلب 
اللغط الأخير حول ما تقوم به الولايات المتحدة وغيرها من الدول الأخرى من تسجيل بيانات 
OLLI‏ الهاتفيةء والبريد الإلكترونيء وغيرها من التحركات المرورية الإلكترونية العديد من هذه 
القضايا إلى المقدمة. وبالإضافة إلى EUS‏ فقد أدى تسريب المعلومات من الاتصالات الحكومية 
عن طريق Wikileaks‏ إلى حدوث عاصفة كبيرة على مدى السنوات القليلة الماضية. وقد أدى 
إفصاح Edward Snowden‏ مؤخرّاء عن برامج الحكومة الأمريكية لجمع البيانات واستخراج 
هذه المعلومات أيضًا إلى ضجة إعلامية كبيرة حول قضايا انتهاك الخصوصية. وأي بحث في هذه 
الموضوعات سوف يسفر عن الكثير من الروابط ووجهات النظر. وبصفتك محترقًا لعلم البيانات» 
فإنه ينبغي عليك أن تدرك أن مثل هذه القضايا يمكنها أن تُحدث فرقًا كبيرا في سمعة منظمتك. 

وهناك أداتان فعالتان لجمع المعلومات حول الأفراد وهما ملفات تعريف الارتباط وبرامج 
التجسس. وقد بدأت وسائل تسجيل الدخول الأحادي التي تسمح للمستخدم بالوصول إلى خدمات 
متنوعة من pu‏ الخدمة تثير بعض نفس المخاوف ia‏ ملفات تعريف الارتباط. وهناك خدمات 
مثل (MSN 5 Yahoos Google)‏ تطلب من المستهلكين بشكل دائم إدخال ملف تعريف 
المعلومات مع كلمة مرور واستخدام هذه المعلومات وكلمة المرور بشكل متكرر للوصول إلى 
الخدمات في مواقع متعددة. وقد ذكر النقاد أن مثل هذه الخدمات ينتج عنها نفس الفرص التي 
تنتج عن ملفات تعريف الارتباط لانتهاك خصوصية الفرد. 

وقد يؤدي استخدام تقنيات الذكاء الاصطناعي في الإدارة وتطبيق القوانين واللوائح إلى زيادة 
المخاوف العامة فيما يتعلق بخصوصية المعلومات. وهذه المخاوفء التي نتجت عن القدرات الملموسة 
للذكاء الاصطناعيء سوف تتعين معالجتها في بداية أي محاولة لتطوير الذكاء الاصطناعي تقريبًا. 

هناك العديد من المستخدمين غير مُدركين للمعلومات الشخصية التي يتم تعقبها من خلال 
استخدامهم للهواتف الذكية. وهناك العديد من التطبيقات التي تجمع بيانات الممستّخدم من 
خلال تعقب كل هاتف أثناء انتقاله من بُرج خلية إلى آخرء ومن خلال أجهزة تحديد المواقع 
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والتي تنقل مواقع المُستخدمينء فضلًا عن تجميع البيانات من الهواتف التي تنقل ابمعلومات عبر 
نقاط اتصال -Wi-Fi‏ وعلى الرغم من زعم مطوري التطبيقات الأساسيين أنهم دقيقون للغاية 
ويعملون على حماية خصوصية المستخدمينء إلا أنه من المثير للاهتمام ملاحظة مقدار المعلومات 
المتوفرة من خلال استخدام جهاز واحد. وقد حدث جدل مؤخرًا بين كل من شركة Apple‏ 
والحكومة الأمريكية حول طلب حكومة الولايات المتحدة لإلغاء قفل الأيفون (iPhone)‏ ورفض 
شركة Jof‏ القيام بتعديل برامجها من أجل تلبية هذا الطلب. حيث تزعم شركة Apple‏ أنها تجمع 
معلومات قليلة أو تكاد تكون معدومة حول عملائها من مُستخدمي أيفون. وعلى الجانب SSII‏ 
فإن Google‏ يجمع الكثير من المعلومات المفيدة حتى يتمكن من تقديم معلومات استباقية 
للمُستخدمين حول التقويم الخاص بهم. والمطاعم امْقَّضلة والأنشطة القادمة, وغيرها. كما 
ينبغي على أي مُطور تطبيق تحليلات أن يضع في اعتباره قضايا الخصوصية. 
الأمن الداخلي والخصوصية الفردية: 

على الرغم من أن الكثيرين يعتبرون أن استخدام تقنيات التحليلات مثل استخراج وتفسير 
محتوى coL LISTE‏ الهاتفيةء والتق اط صور للأشخاص في أماكن معينة وتحديدهاء واستخدام 
الماسحات الضوئية لرؤية متعلقاتك الشخصية: مثابة انتهاك للخصوصية. إلا أن العديد من الناس 
يدركون أن تلك الأدوات التحليلية هي وسيلة فعالة cols‏ كفاءة لزيادة الأمنء على الرغم من 
uas‏ خصوصية العديد من الأبرياء للانتهاك. 

وتقوم حكومة الولايات المتحدة بتطبيق تقنيات تحليلية على نطاق عامي في الحرب على 
الإرهاب. ففي العام ونصف الأول بعد أحداث الحادي عشر من سبتمبر ٠۲٠١١‏ قامت سلاسل 
محلات السوبر ماركت» ومتاجر مستلزمات تجديد المنازل» وغيرهم من تجار التجزئة بتسليم 
كميات هائلة من سجلات العملاء طوعًا إلى وكالات تنفيذ القانون الفيدراليةء منتهكة في الغالب 
سياسات الخصوصية AE‏ وقد استجاب الكثير من الآخرين لأوامر ا محكمة في الحصول على 
معلومات» كما يقتضي القانون. وتملك حكومة الولايات المتحدة الحق في جمع بيانات الشركة 
بموجب التشريع الذي تم تمريره بعد أحداث الحادي عشر من سبتمبر .7٠١١‏ ويقوم مكتب 
التحقيقات الفيدرالي (FBI)‏ الآن باستخراج كميات هائلة من البيانات» oo‏ عن أي نشاط يمكن 
أن يشير إلى وجود مؤامرة إرهابية أو جريمة. 

الجدير بالذكر أن قضايا الخصوصية كثيرة. ونظرًا لأن الحكومة تحصل على البيانات الشخصية 
للكشف عن أنماط النشاطات ال مريبةء فهناك احتمال أن تُستّخدم هذه البيانات بشكل غير لائق أو 
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غير قانوني. ويرى الكثيرون أن مجرد جمع البيانات يُعد انتهاكًا لحريات وحقوق المواطنين. فهم 
يرون ضرورة وجود منظمة رقابة «للإشراف على المراقبين» للتأكد من أن وزارة الأمن الداخلي 
لاتحصل على البيانات دون داع لذلك. وبدلًا من ذلك فإنه ينبغي الحصول على البيانات 
والمعلومات التي لها صلة وثيقة با موضوع فقط والتي يمكن استخراجها لتحديد الأنماط التي يمكن 
أن تؤدي لوقف أنشطة الإرهابيين» وهذه ليست بالمهمة السهلة. 


قضايا تقنية حديثة في الخصوصية والتحليلات: 


يعتمد أكثر مقدمي خدمات الإنترنت مثل Twitters Facebooks Google‏ وغيرها على 
تحقيق الدخل من إجراءات ا مستخدمين. فهم يفعلون ذلك بطرق مختلفة, غير أن كل هذه 
الأساليب في النهاية تصل إلى ملف تعريف امْستخدم أو تفضيلاته اعتمادًا على استخدامه. ومع 
تزايد مُستخدمي الإنترنت بوجه عام ومُستخدمي الأجهزة المحمولة بوجه خاصء تم تأسيس 
العديد من الشركات لاستخدام التحليلات المتقدمة لتطوير ملفات تعريف المستخدمين اعتمادًا 
على استخدام الأجهزة والحركةء وجهات الاتصال الخاصة بال ممستخدمين. وتحتوي مجلة Wall‏ 
Street‏ على مجموعة ممتازة من ال مقالات تحت عنوان )2016 (WallStreetJournal.com,‏ 
«yg .«What They Know»‏ تحديث هذه المقالات باستمرار لتسليط الضوء على أحدث 
التقنيات وقضايا الخصوصية / الأخلاقية. وقد شملت إحدى الشركات المذكورة في هذه السلسلة 
Rapleaf‏ (وهي OYI‏ جزء من -(Towerdata‏ وتدّعي تقنية Rapleaf‏ أنها قادرة على توفير ملف 
تعريف pE AAI‏ بمجرد معرفة عنوان البريد الإلكتروني الخاص به. ومن الواضح أن تقنيتهم 
مُكُنهم من جمع معلومات مهمة. وهناك شركة أخرى تهدف إلى تحديد الأجهزة على أساس 
استخدامها وهي شركة -BlueCava‏ والتي اتحدت مؤخرًا مع شركة -(Qualia.com) Qualia‏ 
وتقوم تقنية BlueCava‏ الخاصة بشركة Qualia‏ بإرفاق ملف شخمي لتتمكن من التعرف على 
امُستّخدم باعتباره فرداً واحداً أو عائلة على الرغم من أنهم قد يستخدمون العديد من التليفونات 
ا محمولة وأجهزة الحاسب المحمولة. وتقوم كل هذه الشركات بتوظيف التقنيات Jia‏ التجميع 
واستخراج الارتباط لتطوير ملفات تعريف الل تَخدمين. ومن المؤكد أن مثل هذه التطبيقات 
التحليلية تثير أسئلة شائكة حول انتهاك خصوصية المُسْتَخدمين. وبالطبع» فإن العديد من 
الشركات التحليلية حديثة الظهور في هذا المجال ye‏ احترام خصوصية المُسْتَخدمء بيد أنه كثير؟ 
ما يتم الإبلاغ عن حدوث انتهاكات. Aid‏ كانت شركة Rapleaf‏ (وكما أشرنا s]‏ أنها متحدة 
الآن مع (Towerdata‏ تجمع معلومات غير مُصَرَّح بها eL‏ من مستخدمي | Facebook‏ 
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وتم حظرها لاحقًا من .Facebook‏ وقد ذكر عامود في مجلة Time‏ بقلم )2011( Joel Stein‏ 
أنه بعد مرور ساعة من إعطاء عنوان بريده الإلكتروني إلى شركة متخصصة في مراقبة معلومات 
(reputation.com) seas Ll‏ تمكنوا بالفعل من اكتشاف رقم الضمان الاجتماعي الخاص 
به ag‏ هذا الرقم مفتاحًا للوصول إلى معلومات خاصة عن eX Ll‏ وقد يؤدي إلى سرقة 
الهوية. ولذ فإنه ينشأ عن انتهاكات الخصوصية مخاوف من السلوك الإجرامي الذي يستند إلى 
معلومات المُستخدمء وهذا المجال يُعد مصدر قلق كبير ويحتاج إلى دراسة متأنية. وسيقوم موقع 
الويب الخاص بهذا الكتاب بتحديث التطورات الجديدة. sg‏ موقع مجلة «What They‏ 
Wall Street‏ «Kn0wمصدرا‏ ينبغي الرجوع إليه بشكل دوري. وهذه الأمثلة لا توضح فقط قوة 
التحليلات في التمكن من معرفة المزيد حول العملاء الممستهدفين, بل إنها أيضًا تعمل مثابة تحذير 
لمحترفي التحليلات بشأن كونها حساسة تجاه الخصوصية والقضايا الأخلاقية. 

وهناك مجال تطبيق آخر يجمع بين تأثير تقنية المعلومات التنظيمية: والبيانات الضخمة, 
وأجهزة الاستشعارء والاهتمامات المتعلقة بالخصوصية يقوم بتحليل سلوكيات الموظف معتمدًا 
على البيانات التي يتم جمعها من أجهزة الاستشعار التي يرتديها الموظفون في الشارة. وهناك 
شركة واحدة, وهي Humanyze‏ ذكرت أن العديد من هذه التطبيقات هي جزء لا يتجزأ من 
أجهزة الاستشعار التي يرتديها الموظفون. وتقوم هذه المستشعرات بتعقب كل تحركات الموظف. 
وبطبيعة iod‏ فإنه ينشأ عن ذلك قضايا خصوصية كبيرة. فهل يجب أن تكون الشركات قادرة 
على رصد تحركات موظفيها بهذا التدخل؟ وقد أفادت Humanyze‏ أن تحليلاتها تقدم تقريرًا على 
أساس إجمالي عملائها فقطء فلا تتم مشاركة بيانات eal all‏ الفردية. وقد لاحظوا أن بعض 
أصحاب العمل يرغبون في الحصول على بيانات فردية للموظفين, بيد أن عَفُدهم gig‏ هذا النوع 
من المشاركة بشكل واضح. وعلى أي حالء فإن أجهزة الاستشعار تؤدي إلى مستوى آخر من المراقبة 
والتحليلات» الأمر الذي يفرض أسئلة مثيرة للاهتمام تتعلق بالخصوصيةء والقوانينء والأخلاق. 


من يمتلك بياناتنا الخاصة؟ 


مع النمو الأخير للبيانات حسب استخدامنا للتقنية وقدرة الشركات على الوصول إليها 
واستخراجهاء فإن النقاش المتعلق بالخصوصية يؤدي LAÍ‏ إلى السؤال الواضح حول لمن تكون ملكية 
بيانات pasé ubl‏ وقد سلط (Y- Y) Welch‏ الضوء على هذه القضية في عمود Bloomberg‏ 
-Businessweek‏ وإليك مثالا على سيارة جديدة نسبيًاء حيث تم تجهيز السيارة بالعديد من 
أجهزة الاستشعار Fs‏ بأجهزة استشعار ضغط الإطارات وصولًا إلى أجهزة ois‏ الموقع GPS‏ والتي 
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يمكنها تتبع المكان الذي تذهب إليهء ومدى السرعة التي تقود بهاء ومتى قمت بتغيير الطرقء وغير 
ذلك. وقد تعرف السيارة حتى وزن الراكب الذي انضم إلى المقعد الأمامي. وكما يشير Welch‏ فإن 
السيارة المتصلة بالإنترنت (وهذا حال معظم السيارات الجديدة) قد تكون كابوسًا خاضًا USIL‏ أو 
”منجم ذهب“ بيانات لمن يستطيع امتلاك هذه البيانات. وهناك معركة كبيرة محتدمة بين شركات 
صناعة السيارات ومقدمي التقنية مثل: (Android Auto) Googles «(Car Play) Apple‏ 
على من يمتلك هذه البيانات ومن الذي يمكنه الوصول إليها. وهذا الأمر أصبح أكثر أهمية لأن 
السيارات أصبحت ذاتية القيادة بشكل ST‏ ومن الممكن أن يكون السائق / الراكب في السيارة 
عميلًا مستقبليًا مستهدفًا بشكل كبير لمنتجات وخدمات محددة ومعروفة بشكل جيد للمنظمة 
القادرة على إنشاء ذلك الملف الشخصي. فعلى سبيل «JUL‏ يجمع تطبيق Google's Waze‏ 
بيانات نظام تحديد الموقع للمُستخدم ا يزيد عن 0٠0‏ مليون مُستخدم لتتبع معلومات الحركة 
المرورية ومساعدة المستخدمين في العثور على أفضل مسارء ولكن عندئذ تُعرض الإعلانات المنبثقة 
على شاشات المستخدمين. ومن الجدير SUL‏ أن تطبيقات Spotifys Yelp‏ والتطبيقات الأخرى 
شائعة الاستخدام في السيارة لها نفس الخطط والتطبيقات. 

وهناك معركة أخرى مشابهة محتدمة حول صحة المستخدمين وبيانات القياس الحيوي. وبسبب 
ا مخاوف الأمنية» فإن العديد من المستخدمين يتحولون إلى تسجيل الدخول الحيوي للتحقق من 
الشخصية باستخدام بصمات الأصابع» وشاشات اللمس» وغير ذلك. ونظرًا لأن هذه المعلومات ينفرد 
بها الفرد دون غيره بشكل كبير» فقد يصبح التنميط المستقباي للمستخدم أكثر دقة. وبالتالي» فإن 
معركة امتلاك هذه المعلومات وربطها ببيانات أخرى تم جمعها تتزايد هي الأخرى. وبالمثل» فإن 
المستشفيات والأخصائيين الطبيين والمختبرات وشركات التأمين تجمع الكثير من المعلومات حول 
تاريخنا الطبي. وعلى الرغم من وجود قوانين صارمة في الولايات المتحدة (مثل: (HIPAA‏ لحماية 
خصوصية المستخدم. إلا أن تجميع مثل هذه المعلومات يطلق العنان للتقدم الكبير في التحليلات 
الصحية. ومع US‏ فإن التحدي المتعلق بالخصوصية: لايزال حقيقيًا للغاية. 

ولكي تكون خبيرا في ales‏ البيانات» فإن الحد الأدنى «eJ‏ أن تكون مدركًا تمامًا للقضايا القانونية 
والأخلاقية التي ينطوي عليها gaz‏ المعلومات التي قد تكون خاصة أو محمية. وهناك سؤال عام 
لتطرحه على نفسك وهو: هل ترغب في تضمين معلوماتك الخاصة في التطبيق الذي تفكر فيه؟ 
الأخلاق في اتخاذ ودعم القرار: 

وينقلنا السؤال الأخير إلى العديد من القضايا الأخلاقية المرتبطة بالتحليلات. وتتضمن القضايا 
الأخلاقية التي قد تمثل أهمية في تنفيذ التحليلات ما يلي: 
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- المراقبة الإلكترونية. 
- الأخلاق à‏ تصميم أنظمة دعم القرار (انظر «Cagle g «Courtney Paradiceg «Chae‏ 2005). 
- سرقة البرمجيات. 
- انتهاك خصوصية الأفراد. 
- استخدام قواعد بيانات الملكية. 
- استخدام الملكية الفكرية مثل المعرفة والخبرة. 
- تعرض اللوظفين لبيئات غير آمنة مرتبطة بأجهزة الحاسب. 
- إمكانية وصول العاملين غير المصرح لهم إلى جهاز الحاسب. 
- دقة البيانات» والمعلومات. والمعرفة. 
- حماية حقوق المستخدمين. 
- سهولة الوصول إلى المعلومات. 
- استخدام أجهزة حاسب الشركة لأغراض ليس لها علاقة بالعمل. 
- مقدار تفويض أجهزة الحاسب في اتخاذ القرار. 

تشكل القيم الشخصية عاملًا ae‏ في قضية اتخاذ القرارات الأخلاقية. وتعتبر دراسة القضايا 
الأخلاقية معقدة نظرًا لأنها متعددة الأبعاد. لذلك؛ فمن المنطقي أن تتطور الأطر لوصف 
العمليات الأخلاقية والنظم. وقد xo‏ كل من Culnan Mason‏ )1995( كيف توسع التقنية 
والابتكار من حجم مجال الأخلاقيات وكيف تناقش نموذجًا للتفكير الأخلاقي ينطوي على أربعة 
أسئلة أساسية للتركيز وهي: 
-١‏ من هو الوكيل؟ 
-Y‏ ما هو الإجراء الذي اتخذ بالفعل أو يجري التفكير فيه؟ 
-Y‏ ما هي نتائج أو عواقب الفعل؟ 
£- هل النتيجة dole‏ أم أنها فقط لجميع أصحاب المصلحة؟ 

كما وصفوا التسلسل الهرمي للتفكير الأخلاقي الذي يستند فيه كل حكم أو عمل أخلاقي إلى 
قواعد وقوانين الأخلاق. والتي تقوم على المبادئ التي تستند بدورها على نظرية أخلاقية. 

هناك قصة واحدة هي التي جعلت العديد من المستخدمين مستائين (على الرغم من lil‏ 
م تكن غير 39 4( فقد كانت تجربة ال Facebook‏ هي إحدى تجارب الماضي وكانت هذه 
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التجربة لتقديم الأخبار المختلفة للمستخدمين ومراقبة ردود أفعالهم العاطفية والتي كانت تقاس 
من خلال الردودء والإعجابات» وتحليل المشاعر» وغير ذلك (وعلى سبيل JEL‏ انظر Goel‏ 2014). 
وتعمل معظم الشركاتء ها في ذلك شركات التقنية على تشغيل اختبار الممستخدم لتحديد الميزات 
التي تحظى هيول الكثيرين إليها أو التي تكون غير dio‏ ومن ثم تقوم الشركات بتعديل عروض 
منتجاتها. ونظرًا لأن ال Facebook‏ كبير للغايةء فإن أمر تشغيل هذه التجربة بدون الموافقة 
المسبقة للمستخدمين يُعد أمرًا غير أخلاقي. s‏ الواقع» فقد اعترف Facebook‏ بخطئه ومن G3‏ 
أعدت المزيد من المراجعة الرسمية من خلال لوحات المراجعة الداخلية وآليات الامتثال الأخرى 
للاختبار في المستقبل. وعلى الرغم من أنهم واجهوا الكثير من الصحف السيئة في البدايةء إلا أن 
ردهم في الوقت المناسب سمح لهم باستعادة مكانتهم سريعًا. 
أسئلة مراجعة على القسم 0-۸: 
-١‏ اذكر بعض القضايا القانونية الخاصة بالتحليلات. 
-Y‏ قم بوصف المخاوف المتعلقة بالخصوصية في التحليلات. 
-Y‏ من وجهة نظركء من الذي ينبغي أن تلك البيانات المتعلقة باستخدامك للسيارة؟ 
-E‏ اذكر القضايا الأخلاقية في التحليلات. 
۸ آثار التحليلات فى المنظمات: نظرة عامة: 
as‏ الأنظمة التحليلية عوامل مهمة في ثورة المعلومات وابمعرفة liag‏ تحول US‏ يلتقي فيه 
معظم الناس الآن فقط للتوصل إلى بنود. وعلى العكس من الثورات البطيئة التي كانت تحدث 
في الماضيء مثل الثورة الصناعيةء فإن هذه الثورة تحدث بسرعة كبيرة وتؤثر على كل جانب من 
جوانب حياتنا. ويلازم هذا التحول السريع مجموعة من القضايا الإدارية والاقتصادية والاجتماعية. 
إن فصل أثر التحليلات عن تلك التأثيرات الخاصة بالأنظمة الأخرى اللحوسبة لهي مهمة صعبة 
لا سيما بسبب الاتجاه نحو الدمج» أو حتى التضمينء والتحليلات مع أنظمة المعلومات الأخرى التي 
تعتمد على الحاسب. وهكن للتحليلات أن يكون لها آثار دقيقة وآثار جسيمة على حد سواء. فهذه 
الأنظمة يمكنها أن تؤثر على الأفراد والوظائف, بالإضافة إلى أنها يمكنها التأثير Ul‏ على هياكل عمل 
الإدارات والوحدات داخل المنظمة. كما هكن أن يكون لها أيضًا تأثيرات كبيرة على المدى الطويل 
على الهياكل التنظيمية الإجمالية» والصناعات بأكملهاء والمجموعات. والمجتمع ككل (أي: أثر كلي). 
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وسوف يكون للنمو المفاجئ في التحليلات» والذكاء الاصطناعيء والحوس بة المعرفية أثر كبير 
على مستقبل المنظمات. ويمكن تقسيم أثر أجهزة الحاسب والتحليلات إلى ثلاث فئات عامة: 
تنظيمية» وفردية» ومجتمعية. وقد كان لأجهزة الحاسب العديد من التأثيرات في كل فئة من هذه 
الفئات. ولا يمكننا النظر في جميع هذه الأمور في هذا القسم. لذا؛ فإننا سوف نتطرق في الفقرات 
التالية إلى الموضوعات التي نرى أنها أكثر صلة بالتحليلات. ويوضح الشكل (V-A)‏ الموضوعات 
العامة التي نخطط لتغطيتها. 




















شكل :V-A‏ أثر التحليلات على المنظمات 
وحدات تنظيمية جديدة: 


ويتمثل أحد التغييرات في الهيكل التنظيمي في إمكانية إنشاء قسم للتحليلات» أو قسم ذكاء 
الأعمالء أو قسم ele‏ البيانات الذي تلعب فيه التحليلات دورًا Lus)‏ وهذه الوحدة الخاصة 
يمكن دمجها مع وحدة التحليل الكمي أو استبدالها أو يمكن أن تكون كيانًا جديدًا Gle‏ وبعض 
الشركات الكبيرة لديها وحدات أو إدارات منفصلة لدعم القرار. فعلى سبيل JAL‏ فإن العديد 
من البنوك الكبرى لديها مثل هذه الإدارات في أقسام الخدمات امالية الخاصة بها. كما أن العديد 
من الشركات لديها وحدات صغيرة من ele‏ البيانات أو ذكاء الأعمال / مستودع البيانات. oleg‏ ما 
تشارك هذه الأنواع من الإدارات في التدريب بالإضافة إلى أنشطة تطوير الاستشارات والتطبيقات. 
وهناك شركات أخرى فوّضت أحد JLS‏ مسؤولي التقنية ليكون مس Sa‏ عن ذكاء الأعمال. وعن 
الأنظمة ASI‏ بالإضافة إلى تطبي قات التجارة الإلكترونية. وهناك شركات Jis‏ شركة Target‏ 
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وشركة Walmart‏ لديها استثمارات كبيرة في مثل هذه الوحدات» والتي تعمل باستمرار على تحليل 
بياناتها لتحديد كفاءة التسويق وإدارة التوريد من خلال فهم تفاعلات (JS‏ من العملاء والموردين. 
وعلى الجانب الآخرء فإن هناك شركات عديدة تقوم بدمج تخصصات ele‏ التحليلات / البيانات 
داخل المجالات الوظيفية مثل التسويقء والتمويلء والعمليات. وبشكل عام فإن هذا المجال 
هو أحد المجالات التي يوجد بها فرص عمل كبيرة حاليًا. وقد حددنا في الفصل الأول عناوين 
الوظائف التي لها صلة بهذا الموضوع كما سنقدم Ule los‏ لعالم البيانات JUL‏ في القسم التالي. 
وقد أدى نمو صناعة ذكاء الأعمال إلى تكوين وحدات جديدة داخل الشركات التي تقدم خدمات 
تقنية المعلومات أيضًا. فعلى سبيل «JEU‏ قامت IBM‏ قبل بضع سنوات» بتشكيل وحدة أعمال 
جديدة تركز على التحليلات. وقد تضمنت هذه المجموعة وحدات في ذكاء الأعمالء ونماذج 
الأمثلية» والتنقيب ف البيانات» وأداء الأعمال. والأهم من ذلك هو أن المجموعة لا تركز فقط 
على البرمجيات» بل إنها تركز بشكل أكبر على الخدمات / الاستشارات. وكما هو مُلاحظ في الأقسام 
السابقةء فإن النمو الهائل في صناعة التطبيقات قد أنشأ العديد من الفرص للشركات الجديدة التي 
يمكنها توظيف التحليلات وتقديم تطبيقات مبتكرة في أي مجال محدد. كما لاحظنا فيما سبق 
كيف تقوم الشركات الصناعية التقليدية في العصر الصناعي مثل شركة General Electric‏ وشركة 
Siemens‏ بإعادة تأهيل نفسها لتوليد عائدات كبيرة من تقديم خدمات التحليلات التي لها صلة 
بمنتجاتها وخدماتها. وهذا من شأنه أن يغير هيكل السلطة التنظيمية؛ نظرًا لأن هيكل القوة 
التنظيمية bole‏ ما يُشتق من المكان الذي يتم فيه إنشاء معظم الدخل. 


إعادة تصميم المُنظمة من خلال استخدام التحليلات: 


يقوم مجال بحثي وعملي حديث الظهور بتوظيف تقنيات علم البيانات لدراسة الديناميكيات 
التنظيميةء وسلوك الأفراد. وإعادة تصميم المنظمة لتحقيق أهدافها بشكل أفضل. وتعرف 
تطبيقات هذه التحليلات في الواقع باسم «تحليلات الأشخاص». فعلى سبيل JÈL‏ تُستَخدّم 
التحليلات من قبل إدارة الموارد البشرية لتحديد المرشحين المثاليين من التجمع الذي pa‏ سير 
ذاتية للمنظمة: أو حتى من خلال gazi‏ أوسع مثل -LinkedIn‏ وقد تم تطوير التطبيقات 
لتحديد أفضل المرشحين الذين لا يحتمل مغادرتهم للمنظمة. فالإبقاء على الموظف يشبه الإبقاء 
على العميل» ولذلكء فإن تقليل ”الحركة“ داخليًا لهو أمر مهم بنفس القدر لنجاح المنظمة. 

ويتعلق مجال التطبيق الحديث والأكثر إثارة بفهم سلوك الموظفين من خلال مراقبة تحركاتهم 
داخل المنظمة واستخدام تلك المعلومات لإعادة تصميم التخطيط أو لإعادة تشكيل الفرق لتحقيق 
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أداء أفضل. وهناك شركة تُسمى Humanyze‏ (كانت معروفة سابقًا باسم Sociometric Solutions‏ 
c5$55‏ في القسم (0-A‏ لديها شارات gaas‏ نظام تحديد المواقع GPS‏ وجهاز استشعار. وعند 
ارتداء الموظفين لهذه الشارات» يتم تسجيل جميع تحركاتهم. وحسبما وَرَّد فقد تمكنت شركة 
Humanyze‏ من مساعدة الشركات في التنبؤ بأي نوع من الموظفين من ell‏ بقاؤه بالشركة أو 
مغادرتها على أساس تفاعلات هؤلاء الموظفين مع غيرهم من الموظفين الآخرين. فعلى سبيل JEL‏ 
الموظفون الذين يبقون في مقصوراتهم الخاصة تكون فرصة ترقيهم في سلم الشركات أقل بكثير 
من الموظفين الذين يتنقلون ويتفاعلون مع غيرهم من الموظفين الآخرين على نطاق واسع. وقد 
ساعد جمع وتحليل البيانات المتشابهة شركات أخرى على تحديد حجم قاعات المؤتمرات المطلوبة 
أو حتى تصميم المكتب لتحقيق أقصى قدر ممكن من الكفاءة. ووذقًا lh‏ ورد بموقع Humanyze‏ 
على الإنترنت» فقد أرادت إحدى الشركات فهم خصائص قادتها بشكل أفضل. ومن خلال تحليل 
البيانات من تلك الشارات» تمكنت الشركة من إدراك أن القادة الناجحين لديهم بالفعل شبكات 
أكبر يتفاعلون معهاء كما أنهم يقضون Ess‏ أطول في التفاعل مع الآخرينء فضلًا عن أنهم يتمتعون 
بالنشاط jadi‏ وقد استُخْدِمَت المعلومات التي جُمعَّت من جانب قادة الفرّق لإعادة تصميم 
مساحة العمل والمساعدة في تحسين أداء القادة الآخرين. ومن الواضح أن هذا يؤدي إلى قضايا 
تتعلق بالخصوصيةء غير أن مثل هذه الدراسات قد تكون قابلة للتطبيق داخل المنظمة. ويحتوي 
موقع Humanyze‏ على العديد من دراسات الحالة المثيرة للاهتمام والتي تقدم أمثلة على كيفية 
استخدام تقنيات البيانات الضخمة لتطوير هياكل فريق أكثر كفاءة وتصميم تنظيمي. 


أثر التحليلات على أنشطة المديرين» وأدائهم» ورضاهم الوظيفي: 


على الرغم من أن العديد من الوظائف قد تتمتع بثراء كبير في جانب التحليلات» إلا أن هناك 
وظائف أخرى قد تصبح أكثر رتابة وأقل إرضاء. فعلى سبيل JEU‏ قبل أكثر من ٠غ le‏ تنبا 
ob (1971) Argyris‏ أنظمة ا معلومات التي تعتمد على الحاسب من شأنها أن تقلل من السلطة 
التقديرية الإدارية في عملية اتخاذ القرار وهذا يؤدي إلى عدم رضا المديرين. ومع ذلك فقد وجد كل 
من Davenport‏ و (à (2005) Harris‏ دراستهم لنظم القرار الآلي أن الموظفين الذين يستخدمون 
هذه الأنظمة. وخصوصًا من يتم تمكينهم بواسطة الأنظمة» كانوا أكثر ló)‏ عن وظائفهم. وإذا 
أمكن stol‏ العمل الروتيني والعمل البسيط باستخدام نظام تحليليء فإنه يجب تهيئة المديرين 
والعاملين في مجال المعرفة مواجهة المزيد من التحديات. ويعد أهم عمل يقوم به المديرون هو 
اتخاذ القرارات. وتستطيع التحليلات أن تغير الطريقة التي يتم بها اتخاذ العديد من القرارات» 
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وبالتالي فإنه هكن تغيير مسؤوليات الوظائف الخاصة بال مديرين. وعلى سبيل «JUL‏ فقد وجد 
«Maguiragas Plaisentg ;Perez-Cascante jù Js‏ بالإضافة إلى Bernard‏ )2002( أن نظام 
دعم القرار قد استطاع تحسين أداء كل من المديرين الحاليين والمديرين الجدد فضلًا عن الموظفين 
الآخرين. فقد ساعد المديرين على اكتساب المزيد من ال معارف والتجاربء والخبرة وبالتالي تعزيز 
جودة guo‏ القرار. وقد أعلن العديد من المديرين أن أجهزة الحاسب قد منحتهم أخيرًا الوقت 
للخروج من المكتب والتواجد في الساحة. كما وجدوا أيضًا أن بإمكانهم قضاء المزيد من الوقت في 
التخطيط للأنشطة Vas‏ من إضاعة الوقت في حل المشاكل حيث إنه من الممكن تنبيههم للمشاكل 
المحتملة في وقت مبكر وذلك بفضل العوامل الذكية وغيرها من الأدوات التحليلية. 


ويكمن الجانب الآخر من التحدي الإداري في قدرة التحليلات على دعم عملية صنع القرار 
بشكل «ele‏ بالإضافة إلى قدرتها على التخطيط الإستراتيجي والتحكم في القرارات بشكل خاص. 
حيث هكن للتحليلات أن تغير عملية صنع القرارء بل يمكنها تغيير أنماط اتخاذ القرار. فعلى 
سبيل «JUL‏ يتم الانتهاء من جمع المعلومات من أجل صنع القرار بسرعة أكبر في حالة استخدام 
التحليلات. ax‏ نُظم معلومات المؤسسة مفيدة للغاية في دعم الإدارة الإستراتيجية. وتُستخدم 
الآن تقنيات التنقيب في البيانات والنص والويب لتحسين المسح البيئي الخارجي للمعلومات. 
ونتيجة لذلك؛ يستطيع المديرون تغيير نهجهم لحل المشاكل وتحسين قراراتهم بسرعة. ويقال إن 
ستاربكس قامت مؤخرًا بتقديم مشروب قهوة جديد. واتخذت قرارها بش أن التسعير من خلال 
تجربة عدة أسعار مختلفة ورصد ردود الفعل على وسائل التواصل الاجتماعي على مدار اليوم» 
وهذا يعني أن أساليب جمع البيانات لأحد المديرين قد تختلف الآن بشكل كبير عما كانت عليه 
في الماضي. وتشير الأبحاث إلى أن معظم المديرين oake‏ إلى العمل على عدد كبير من المشاكل 
في وقت واحدء متنقلين من مشكلة إلى أخرى كأنما ينتظرون المزيد من المعلومات عن مشكلتهم 
الحالية (انظر .Ghoshals Quinn Lampelg Mintzberg‏ 2002). وتقوم تقنيات التحليلات 
بتقليل الوقت المطلوب لإتمام المهام في عملية اتخاذ القرار كما أنها تقضي على بعض فترات الانتظار 
التي تعطل الإنتاج وذلك من خلال توفير ا معرفة والمعلومات. وبالتاليء يعمل المديرون على عدد 
أقل من المهام خلال كل يوم غير أنهم يكملون المزيد منها. وقد يكون تقليل وقت البدء المرتبط 
بالانتقال من مهمة إلى أخرى هو أهم مصدر لزيادة الإنتاجية الإدارية. 

وقد يكون من بين الآثار المحتملة الأخرى للتحليلات على وظيفة المدير هو التغيير في متطلبات 
القيادة. والتي تعتبر الآن من الصفات القيادية الجيدة بشكل عام والتي قد تكون تغيرت بشكل 
كبير من خلال استخدام التحليلات. فمثله يُستبدل التواصل وجهًا لوجه بشكل متکرر بالبريد 


vee‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


الإلكترونيء ومواقع الويكيء والؤتمرات المحوسبة؛ وبالتالي فإن الصفات القيادية التي ترجع إلى 
المظهر الخارجي من الممكن أن تصبح أقل أهمية. 
وفيما يلي بعض الآثار المحتملة للتحليلات على وظائف المديرين: 
- تتطلب عملية اتخاذ العديد من القرارات خبرة (تجربة) أقل. 
- هكن اتخاذ القرار بشكل أسرع بسبب توافر المعلومات وجعل بعض مراحل اتخاذ القرار آلية. 
- يتطلب توفير الدعم لكبار المسؤولين التنفيذيين اعتمادًا أقل على الخبراء وا محللين؛ ويستطيع 
المديرون فعل ذلك بأنفسهم مساعدة الأنظمة الذكية. 
- تنم إعادة توزيع الطاقة بين المديرين. UIS)‏ زادت قدرة المعلومات والتحليل التي تلكونهاء 
زادت القوة لديهم). 
- دعم القرارات المعقدة يجعلها أسرع في التطورء كما أنها ستكون ذات جودة أفضل. 
- يتم التعجيل با معلومات المطلوبة لاتخاذ القرارات عالية المستوى أو حتى يتم إنشاؤها ÉIS‏ 
- قد تؤدي الآلية في القرارات الروتينية أو في مراحل عملية اتخاذ القرار (مثلء اتخاذ القرارات عبر 
الخطوط الأمامية واستخدام (ADS‏ إلى إلغاء بعض المديرين. 
وبشكل ele‏ تبين أن وظيفة المديرين المتوسطين هي الوظيفة الأكثر ass‏ لأن تكون آلية. 
حيث يقوم مديرو المستوى المتوسط باتخاذ قرارات روتينية إلى حد da‏ والتي يمكن جعلها آلية 
بالكامل. وبالنسبة لمديري ال مستويات الدنيا فإنهم لا يقضون الكثير من الوقت في اتخاذ القرار. 
فهم بدلا من ذلكء يقومون بالإشراف على غير المديرين» ویدیرونه م ويحفزونهم. وقد تكون 
بعض قراراتهم الروتينية آليةء مثل الجدولة؛ Ul‏ القرارات الأخرى التي تنطوي على جوانب سلوكية 
فلا يمكن جعلها آلية. وعلى أي حال فإننا حتى لوقمنا بجعل دورهم الأسامي OE‏ بشكل كاملء 
فإننا لن نتمكن من جعل وظائفهم آلية. ويوفر الويب فرصة لجعل مهام معينة مموظفي الخطوط 
الأمامية آلية؛ وبالتالي فإن ذلك يؤدي إلى خفض عبء العمل على المديرين المخولين بالموافقة. أما 
وظيفة كبار المديرين فهي أقل dasg‏ وبالتالي يصعب جعلها عملية آلية. 
إعادة الهيكلة الصناعية: 
بدأ عدد قليل من المؤلفين بالتكهن بأثر الذكاء الاصطناعي» والتحليلات» والحوس بة الإدراكية على 
مستقبل الصناعة. وهناك القليل من المصادر الحديثة الممتازة التي يمكن مراجعتها وهي (2016) 
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(Ihe Economist) وتقرير خاص من قبل ذي إيكونوميست‎ Ransbothams (2016) Autor 
gò (2016)ويُعد تقرير‎ McAfees Brynjolfsson وكتاب كتبه كل من‎ (Standage, 2016) 
تقريرًا شاملا إلى حد کبیرء كما أنه ينظر في العديد من الأبعاد لتأثير‎ The Economist إيكونوميست‎ 
التطورات الحالية على الصناعة وا مجتمع. وتتمثل الأسباب الرئيسة في أن التقنية يكن أجهزة الحاسب‎ 
بالطبعء حدث من قبلء في الثورة‎ liag من القيام بالمزيد والمزيد من المهام التي قام بها البشر.‎ ON 
الآلات من القيام بالعديد‎ SS الصناعية. وما يجعل التغيير هذه المرة أكثر أهمية بكثير هو أن التقنية‎ 
من المهام المعرفية. كما أن سرعة التغيير جذرية إلى الحد الذي يدعو إلى التنبؤ بأن الأثر ا محتمل على‎ 
ا منظمات والمجتمع سيكون مهما للغايةء وفي بعض الأحيان لا هكن التنبؤ به. وبالطبع فإن هؤلاء‎ 
حيث يناقش‎ Mol المؤلفين لا يتفقون في تنبؤاتهم. وفي هذه الفقرة دعونا نركز على الآثار التنظيمية‎ 
أن الحوسبة الإدراكية ستحول العديد من الوظائف التي يقوم بها البشر ليتم‎ )2016( Ransbotham 
القيام بها بواسطة أجهزة الحاسبء مما يترتب عليه تقليل تكاليف المنظمات. كما أن جودة ا مخرجات‎ 
elab قد تزيد أيصًا في العمل ابمعرف» والتي ظهرت في العديد من الدراسات التي تقارن أداء الإنسان‎ 
الفائز في لعبة‎ Google أو نظام‎ Jeopardy في‎ IBM Watson لآلة. فالجميع على علم تام بفوز‎ 
ضد الأبطال البشريين. غير أن العديد من الدراسات الأخرى في مجالات محددة مثل التعرف على‎ 60 
لكلام وتفسير الصور الطبية قد أظهرت تفوقًا مماثلا للنظام الآلي في حالة ما إذا كانت المهمة عالية‎ 
dis للاتجاه نحو توفير الأجهزة في جميع الأوقات‎ Bhs فإنه‎ Lad التخصص ولكنها روتينية أو متكررة.‎ 
جميع ابمواقع» فإن ذلك قد يزيد من اتساع امنظمةء مما يؤدي إلى سهولة التدرج وبالتالي منافسة أكبر‎ 
بين المنظمات. وهذه الآثار التنظيمية تعني أن المنظمات التي كانت بارزة بالأمس من الوارد ألا تظل‎ 
في المقدمة إلى الأبدء لأن الحوسبة الإدراكية والآلية يمكنها تحدي اللاعبين الراسخة أقدامهم. وهذا هو‎ 
في صناعة السيارات. وعلى الرغم من محاولة شركات السيارات التقليدية اللحاق بالركب‎ sii الحال‎ 
وشركات التقنية الأخرى تعمل على تعطيل هيكل‎ Teslas Google بسرعة» إلا أن شركات كل من‎ 
الصناعة من خلال تحدي قادة عصر السيارات. وتقوم التحليلات بتمكين العديد من هذه التغييرات.‎ 





أثر الأتمتة على الوظائف: 

كما تناقش التقارير البحثية التي سبق أن حددناها في الفقرة السابقة أيضًا تأثير التقدم في 
e de‏ البيانات والذكاء الاصطناعي على الوظائف البشرية. وكما أوضحنا سابقًاء فإن العديد من 
مهام العاملين في مجال المعرفة GY o Sce‏ تنفيذها -GT‏ وفي الوقت ذاته. فإن التقنية لا تؤدي 
Lilo‏ إلى تقليل عدد الأشخاص الذين يتم توظيفهم. LSS‏ لاحظ Autor‏ )2016( فقد تضاعف 
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عدد ماكينات الصرف (ATM) JYI‏ أربعة أضعاف من حوالي ٠٠١٠٠١‏ إلى ٠٠٠,٠٠١‏ في الفترة بين 
عامي ۱۹۹١‏ و١٠٠٠‏ إلا أن عدد موظفي البنوك قد زاد في نفس الوقت من حوالي نصف مليون 
موظف في عام ۱۹۸۰ إلى حوالي 000.٠٠٠‏ موظف في عام Y «Ve‏ فما حدث هو أن الجزء الروتيني 
من العمل أصبح يتم عن طريق أجهزة الصرف الآلي (ATM)‏ أما موظفو البنك فقد أصبحوا على 
اتصال أفضل بالعملاء كما أصبحوا يركزون GY‏ على خدمات البيع. وبالطبع» فإن بعض هذه 
الخدمات يكن أيضًا تقديمها من خلال نماذج التحليلات التي تحدد العملاء المناسبين للحصول على 
فرصة محددة. وقد قدم )2016( Y Ransbotham‏ آخر. ales‏ ما تعتبر الاستشارات AJ‏ 
مهمة تعتمد على المعرفة. ونظرًا لأن تقنية علم البيانات توفر so‏ مخصصًا لسيناريو محدد OP‏ 
تكاليف هذه الخدمات سوف تنخفض. وهذا سيؤدي إلى تزايد الأشخاص الذين يختارون المطالبة 
Jig‏ هذه الخدمات» مما سيؤدي في النهاية إلى الحاجة لوجود المزيد من البشر للعمل المتقدم. 


ويدعي بعض هؤلاء المؤلفين بأن الأتمتة التي ترجع إلى الحوس بة المعرفية والذكاء الاصطناعي 
سوف تسرع ما يسمى ب «الاستقطاب» لسوق العمل في المستقبل. وهذا يتبعه نمو كبير في 
الوظائف في المستويات العليا والدنيا من سوق العمل غير أن الخسائر تكون في الوسط. وتستمر 
الوظائف التي تتطلب مهارات منخفضة كخدمات الحراسة» والرعاية الشخصيةء وإعداد الطعام, 
وما إلى ذلك في النمو. «Jis‏ فإن الوظائف التي تتطلب مستويات مهارة عالية dox‏ كالتصميم 
الإداري» وتصميم الرسومات. والعمل الحاسوبي تتزايد هي الأخرىء في حين أن الوظائف التي 
تتطلب معرفة متخصصة ”ال مهارات المتوسطة“ والتي تم تطبيقها ho‏ وتكرارًا مع بعض التكيف» 
هي الوظائف الأكثر عرضة للاختفاء. ففي بعض الأحيان تتداخل التقنية في نفسها. فعلى سبيل 
JEL‏ فإن تحليلات IBM Watson‏ تتضمن الآن إمكانات أولية للبدء في طرح الأسئلة التي هكن 
أن يطلبها أحد متخصصي التحليلات من مخزن البيانات» ومن الواضح أنها تُقدم إجابات. وباطثل, 
فإن التحليلات الأخرى - كعروض الخدمات - قد تؤدي إلى تقليل عدد الأشخاص الذين يحتاجون 
إلى الكفاءة عند استخدام برامج التحليلات. 


ويشير تقرير ذي إيكونوميست إلى أنه حتى لو مم يحل الذكاء الاصطناعي محل العمال 
بشكل مباشرء فإن الأمر سوف يتطلب منهم بالتأكيد اكتساب مهارات جديدة ليظلوا قادرين 
على المنافسة. كما أن تعطل السوق Ulo‏ ما يكون غير مريح. وسوف توفر السنوات القليلة 
المقبلة فرضًا ممتازة لمتخصصي التحليلات لتشكيل المستقبل. وقي القسم JI‏ سوف نحدد بعض 
السمات العامة متخصص ele‏ البيانات. 
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الآثار غير المقصودة للتحليلات: 


إلى جانب القضايا التي ناقشناها بالفعل فيما يتعلق بالخصوصية, والأخلاقيات» والأمان, والآثار 
الشخصية / التنظيمية للتحليلات» يجب أن يكون المديرون والمختصون بعلم البيانات على دراية 
بالآثار الاجتماعية طويلة الأجل للنماذج. وقد قدم كتاب صدر Cathy O'Neil J 55a‏ )2016( 
هذه الحجج بشكل جيد للغاية مما لاقى انتشارًا في الأخبار. وقد حصلت O'Neil‏ على الدكتوراه 
في الرياضيات من جامعة هارفارد Harvard‏ وعملت في مجال التمويل وصناعة ee‏ البيانات. وقد 
دفعتها تجاربها وملاحظاتها إلى كتابة كتاب مشهور بعنوان أسلحة تدمير الرياضيات Weapons of‏ 
:Math Destruction‏ كيف تزيد البيانات الضخمة من عدم المساواة وتهدد الديموقراطية. ونحن 
ندعوك لقراءة الكتاب» أو على الأقل الاطلاع على موقع مدونتها عبر .https://mathbabe.org/‏ 
وإلى جانب الترويج لكتابهاء فإن موقع المدونة يسلط الضوء على القضايا الاجتماعية التي تتعلق 
بالتحليلات. كما يمكنك الاطلاع على ملخص / استعراض جيد للكتاب عبر هذا الموقع: http://‏ 
-knowledge.wharton.upenn.edu/article/rogue-algorithms-dark-side-Big-data/‏ 

وتعتقد O'Neil‏ في كتابهاء ob‏ النماذج يجب أن تستوف ثلاثة شروط. فالعديد من النماذج 
الرياضية ليست شفافة. فإذا كان النموذج غير مغهوم» فإن تطبيقه يمكن أن يؤدي إلى عواقب 
غير مقصودة. ثانيّه يجب أن يتسم النموذج بأهداف واضحة قابلة تلقياس الكميء مثل التطبيق 
المشهور للتحليلات في كتاب وفيلم كرة Moneyball JU‏ وقد كان الهدف من هذا النموذج 
هو زيادة عدد مرات الفوز. وقد كانت مقاييس المدخلات المقترحة من العمر يمكن فهمها 
كذلك. بدلا من استخدام قاعدة التشغيل المعلنة والأكثر شيوعًا في قياس (RBI)‏ والتي اقترحها 
الملل واستخدمت في النسب الأساسية والتدابير الأخرى (التي تم حسابها بسهولة وفهمها بسهولة 
من قبل أي شخص لديه مهارات الرياضيات الأساسية). ومن ناحية أخرىء فإن النماذج التي 
Cus‏ لتقييم مخاطر الأوراق المالية المدعومة بالرهن العقاري حيث لا يفهم أحد Gle‏ الافتراضات 
الأساسية سوى المتداولين tog‏ حيث كانوا يتداولون الأوراق AIUI‏ المضمونة على نطاق واسع 
وذلك لأنهم قادوا الأزمة المالية في عام Y+ -A‏ أما الشرط الثالث فهو أن النماذج يجب أن تكون لها 
JT‏ تصحيح GI‏ وعملية في المكان بحيث يتم تدقيق النماذج بانتظام» كما يجري النظر باستمرار 
في المدخلات والمخرجات الجديدة. وهذه المسألة الثالثة تعد بالغة الأهمية في تطبيق النماذج في 
الأماكن الاجتماعية. ومن ناحية أخرى فإن النماذج تديم الفرضيات الخاطئة الكامنة في مرحلة 
النمذجة الأولية. وتناقش O'Neil‏ العديد من المواقف في هذه الحالة. ad‏ تُستخدم في الولايات 
المتحدة لتحديد المدرسين ذوي الأداء الضعيف ومكافأة المعلمين الأفضل. وقد استخدمت هذه 
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النماذج درجات اختبار تلاميذهم. وتروي O'Neil‏ العديد من الأمثلة التي استخدمت النماذج 
لتسريح المعلمين «ضعيفي الأداء» على الرغم من أن هؤلاء المعلمين كانوا محبوبين من قبل الطلاب 
وأولياء الأمور. وتستشهد Lol O'Neil‏ بمثال آخر تتزايد أهميته في العديد من المنظمات» وهو 
أداء العمال؛ cu‏ يتم استخدام النماذج لتحسين جدولة العمال في العديد من المنظمات. às‏ 
العديد من الحالات» يتم تطوير هذه الجداول لتتوافق مع تغيرات الطلب الموسمية واليومية 
إلا أن O'Neil‏ تأسف لحقيقة أن هذه النماذج لا تأخذ في الاعتبار الآثار الضارة لهذا التفاوت 
à‏ الجداول على d‏ هؤلاء العمال ذوي الدخل المنخفض. وهناك أمثلة أخرى من هذا القبيل 
تشمل نماذج تقييم درجة الائتمان والتي تستند على ملامح تاريخية وبالتالي فإنها قد تؤثر EL‏ 
على الأقليات. وبدون وجود آليات لتدقيق هذه النماذج وآثارها غير المقصودة, Ul‏ قد نضر أكثر 
مما ننفع على المدى الطويل. ولذلك؛ فإن متخصص علم البيانات يحتاج إلى إدراك هذه المخاوف. 
أسئلة مراجعة على القسم 5-8: 
-١‏ اذكر آثار التحليلات على اتخاذ القرار. 
-Y‏ اذكر آثار التحليلات على المهام الإدارية الأخرى. 
-Y‏ قم بوصف الوحدات التنظيمية الجديدة التي أنشئت بسبب التحليلات. 
-٤‏ حدد أمثلة أخرى لتطبيقات التحليلات لإعادة تصميم مساحة العمل أو سلوك الفريق. 
0- كيف تؤثر الحوسبة الإدراكية على هيكل الصناعة؟ 
1- ما هي الوظائف التي من المرجح أن تتغير نتيجة التحول للآلية؟ 
-V‏ ادرس تقرير ذي إيكونوميست )2016 (Standage,‏ المذكور في هذا القسم. ما هي الآثار 

الأخرى للآلية؟ وهل وجدتها مثيرة للاهتمام؟ 
ole V-A‏ البيانات كمهنة: 

عام البيانات هو دور أو وظيفة مرتبطة في كثير من الأحيان بالبيانات الضخمة. وقد أصبح 
هذا الدور من أكثر الأدوار المطلوبة في السوق. وفي مقال نُشر في عدد أكتوبر ١٠١١‏ من مجلة 
Harvard Business Review‏ أطلق العالمان D. J. Patil «Thomas H. Davenport‏ على 
وظيفة عاط البيانات بأنها ”الوظيفة 1591 جاذبية في القرن ."YV‏ وقد حددوا في تلك المقالة علماء 
البيانات الأساسيينء والأكثر مهارة alle‏ إضافة إلى من لديهم القدرة على كتابة التعليمات البرمجية 
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(بأحدث لغات ومنصات البيانات الضخمة). وعلى الرغم من أن هذه المهارات المذكورة قد تصبح 
في المستقبل القريب أقل دقة خاصة عندما يحمل العديد من الأشخاص لقب ble»‏ البيانات» على 
بطاقات العمل الخاصة بهم غير أنها تبدو في وقتنا الراهن بأنها أكثر المهارات الأساسية المطلوبة 
من elole‏ البيانات. وستكون أكثر المهارات استمرارية هي حاجة علماء البيانات إلى التواصل بلغة 
يفهمها جميع أصحاب المصلحة. بالإضافة إلى حاجتهم لإظهار المهارات الخاصة التي تتضمن سرد 
القصص مع LLII‏ سواء أكان ذلك ai‏ و / أو بصريًاء )2012 (Davenport, Patil,‏ 

يستخدم علماء البيانات مزيجًا من مهاراتهم الخاصة بالأعمال بالإضافة إلى مهاراتهم الفنية 
لدراسة البيانات الضخمة؛ Čou‏ عن طرق لتحسين ممارسات تحليلات الأعمال الحالية (من وصفي إلى 
تنبّؤي وتوجيهي) ومن ثم تحسين القرارات من أجل فرص الأعمال الجديدة. ومن أكبر الاختلافات 
بين عام البيانات ومُستّخدم ذكاء الأعمال مثل محلل الأعمالء هو أن عاط البيانات يدرس ويبحث عن 
قدرات جديدة» في حين أن مُستخدم ذكاء الأعمال يقوم بتحليل حالات الأعمال والعمليات الحالية. 

كما يُعد الفضول الشديد هو أحد الصفات الغالبة والمتوقعة من OBLI clade‏ بمعنى وجود 
رغبة عند علماء البيانات للتعمق في المشكلة وعدم تناولها danda a‏ بالإضافة إلى العثور على 
الأسئلة في صميمهاء واستخلاصها إلى مجموعة شديدة الوضوح من الفرضيات التي يمكن اختبارها. 
وهذا يستلزم في كثير من الأحيان التفكير الجماعي الذي هيز العلماء الأكثر إبداعًا في أي مجال. 
فعلى سبيل «JEU‏ نحن نعرف عام بيانات يدرس مشكلة الاحتيال والذي أدرك أنها تتشابه مع 
نوع من المشاكل الخاصة بتسلسل الحمض 455521 )2012 (Davenport, Patil,‏ وقد تمكن 
هذا العام هو وفريقه من صياغة حل يقلل من خسائر الاحتيال بشكل كبيرء وذلك من خلال 
الجمع بين تلك blg)‏ المتفاوتة. 
من أين يأتي علماء البيانات؟ 

على الرغم من وجود بعض الخلاف حول استخدام العلم في الاسم غير أن هذا الأمر أصبح أقل 
إثارة للجدل. ويستخدم علماء حقيقيون أدوات صنعها elole‏ آخرون» كوسيلة لتوسيع ام معرفة أو 
يقومون بصنعها إذا لم تكن موجودة. وهذا هو بالضبط ما يُتوقّع القيام به من قبل علماء البيانات. 
فعلى سبيل «JULI‏ ينبغي على علماء الفيزياء التجريبية تصميم ال معدات» وجمع البيانات» وإجراء 
تجارب متعددة لاكتشاف المعرفة وتوصيل نتائجها. وعلى الرغم من أن elole‏ البيانات قد لا يرتدون 
معاطف بيضاء فضلًا عن أنهم قد لا يعيشون في بيئة معملية معقمة. إلا أن ما يفعلونه بالضبط 
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يتمثل في: استخدام الأدوات والأساليب الإبداعية لتحويل البيانات إلى معلومات قابلة للتطبيق لكي 
يستخدمها الآخرون لاتخاذ قرارات أفضل. 

الجدير بالذكر أنه لا يوجد إجماع حول الخلفية التعليمية التي ينبغي أن تكون لدى عام 
البيانات. غير أنه Sole‏ ما يكون المرشح لذلك من أمثال: حاملي ماجستير (أو دكتوراه) في علوم 
الحاسب JYI‏ أو نظم المعلومات الإدارية (MIS)‏ أو الهندسة الصناعيةء أو درجات الدراسات 
التحليلية المشهورة الحديثة. وعلى الرغم من أن كل ذلك قد يكون ضروريًا إلا أنه ليس كافيًا 
لى يطلق على أحد الأشخاص أنه عام بيانات. فمن eal‏ الخصائص التي ينبغي توافرها في عام 
البيانات هي الخبرة الفنية Las‏ عن الخبرة بمجالات تطبيقات الأعمال. وبهذا ا معنى» فإن هذا 
الدور يشبه الأدوار المهنية للمهندس أو الأدوار المهنية لإدارة المشاريع» حيث يتم تقييم الخبرة 
بمقدار (إن م يكن أكثر من) المهارات التقنية والخلفية التعليمية. ولن تكون مفاجأة كبيرة أن 
نرى في غضون السنوات القليلة القادمة شهادة مصممة لعلماء البيانات بشكل خاص (رها يُطلق 
عليها اسم ”محترف ele‏ البيانات“ أو “DSP”‏ للاختصار). 

ونظرًا لأن هذا الدور هو مهنة لمجال لا يزال قيد التعريفء فإن العديد من ممارسات 
هذه المهنة لاتزال تجريبية كما أنها بعيدة عن أن تكون موحدة. وبالتالي» فإن الشركات تكون 
شديدة الحساسية فيما يتعلق aso‏ الخبرة لعالم البيانات. وبنضج هذه ull‏ وا ممارسات 
ا موحدةء فإن التجربة ستكون أخف من المشكلة عند تعريف ble‏ البيانات. وف الوقت 
الحاضرء فإن الشركات تبحث عن الأشخاص ذوي الخبرة الواسعة في العمل مع البيانات المعقدة 
الذين حظوا بالتوظيف الجيد من بين أولئك الذين لديهم خلفيات تعليمية وعملية في العلوم 
الطبيعية أو الاجتماعية. وقد كان بعض أفضل وأمع علماء البيانات حاصلين على الدكتوراه 
في مجالات مقصورة على فئة معينة ele Jio‏ البيئة وبيولوجيا النظم Davenport, Pati)‏ 
2. وعلى الرغم من عدم وجود إجماع حول المكان الذي az b‏ علماء البيانات» إلا أن 
هناك فهمًا مشتركًا للمهارات والصفات المتوقع توافرها في ble‏ البيانات. ويوضح الشكل (A-A)‏ 
رسمًا بيانيًا ie‏ المستوى لهذه المهارات. 
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شكل A-A‏ المهارات التي تحدد عام البيانات 
فمن المُتوقع أن يكون لدى عام البيانات مهارات شخصية Jis‏ الإبداع. والفضولء وتبادل 
ا معلومات / العلاقات بين الأشخاصء والخبرات الخاصة بالمجال» وتعريف المشكلة. والإدارة (تظهر في 
أشكال سداسية خضراء الخلفية في أعلى الجانب الأيسر من الشكل) فضلًا عن مهارات فنية سليمة 
مثل معالجة البيانات» والبرمجة / القرصنة / البرمجة النصية» والإنترنت ووسائل التواصل الاجتماعي 
/ تقنيات الشبكات (تظهر في أشكال سداسية ذات خلفية رمادية أسفل يمين الشكل). وتدور رؤية 
فنية (V-A)‏ حول الإعلان عن وظيفة نموذجية لعام البيانات. 
رؤية فنية VA‏ 
وظيفة نموذجية لعلماء البيانات 

تبحث [بعض الشركات] عن عام بيانات لينضم إلى فريق تحليلات البيانات الضخمة لدينا. 

ومن المتوقع أن يكون كل فرد في هذا الدور مستعدًا للعمل كمهندس ual)‏ وباحث كمي. 

وسوف يكون للمرشح JULI‏ اهتمام كبير في دراسة شبكة اجتماعية عبر الإنترنت وشغف 

لتحديد الأمئلة التي تساعدنا في تشكيل أفضل المنتجات بالإضافة إلى الإجابة عن هذه الأسئلة. 
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المسؤوليات: 

- العمل عن كثب مع فريق هندسة المنتجات لتحديد الأسئلة المهمة عن المنتج 
والإجابة عليها. 

- الإجابة على الأسئلة المتعلقة بالمنتجات باستخدام الأساليب الإحصائية المناسبة 
على البيانات المتاحة. 


- نقل النتائج ممديري ومهندسي الإنتاج. 

- إدارة مجموعة البيانات الجديدة وتحسين مصادر البيانات الموجودة. 

- تحليل وتفسير نتائج تجارب المنتج. 

- تطوير أفضل الممارسات للآجهزة والتجريب ونقل ذلك إلى فرق هندسة المنتجات. 

المتطلبات: 

- الحصول على ماجستير أو دكتوراه في أحد المجالات الفنية ذات La‏ أو أن يكون 
لديه أكثر من € سنوات من الخبرة في ass‏ صلة بهذا المجال. 

- خبرة واسعة في حل المشكلات التحليلية باستخدام الأساليب الكمية. 


- التعاون في المعالجة البارعة وتحليل البيانات المعقدة ذات الحجم الكبير والبعد 
العالي من مصادر مختلفة. 


- وجود شغف قوي للبحث التجريبي والإجابة عن الأسئلة الصعبة باستخدام البيانات. 
- منهج تحليلي مرن يسمح للنتائج مستويات متفاوتة من الدقة. 

- القدرة على توصيل التحليل الكمي المعقد بطريقة واضحة. ودقيقةء وقابلة للتطبيق. 
- الطلاقة في استخدام لغة برمجة نصية واحدة على الأقل مثل Python‏ أو PHP‏ 
- الإهام بقواعد البيانات العلائقية و:50[1. 

- الخبرة المعرفية بأداة تحليل مثل R‏ أو Matlab‏ أو 545. 


خبرة في العمل مع مجموعات كبيرة من البيانات, بالإضافة إلى الخبرة في العمل مع 
أدوات الحوسبة المقسمة $265 إلى Hive Hadoop .MapReduce)‏ إلخ). 
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ونادرًا ما يكون هناك أشخاص يتمتعون بهذه المجموعة من المهارات» مما يفسر سبب النقص 

في عدد علماء البيانات. وبسبب زيادة الطلب على هذه الفئة من الأفراد الأقل Éa‏ تكون 
رواتب البداية لعلماء البيانات أعلى بكثير من ستة أرقام (بالدولار الأمريكي). أما الأشخاص الذين 
لديهم خبرة dis als‏ بالإضافة إلى أنهم يملكون خبرة في مجال معين» فإن رواتبهم del‏ من ذلك 
بكثير. وفي معظم المنظمات» سيكون من الضروري بناء فريق من الأشخاص الذين لديهم هذه 
المهارات بشكل جماعي بدلا من البحث عن أفراد يتمتعون بهذه القدرات» وفيما ياي بعض 
التصريحات الحديثة حول علماء البيانات: 
- يقوم علماء البيانات بتحويل البيانات الضخمة إلى قيمة ضخمة: حيث يقدمون المنتجات التي 

تُرضي المستخدمين كما يُقدمون الأفكار التي تُخبر بقرارات الأعمال. 
- إن عاط البيانات ليس بارعًا في التعامل مع البيانات فحسب» بل إنه يُقدر LAÍ‏ البيانات نفسها 

كأصل لا يُقدر بثمن. 
- بحلول عام ۲٠۲۰‏ سيكون هناك 6,0 مليون وظيفة جديدة لعلم البيانات» والتي لن يتم URL‏ 

سوى ثلثها فقط نظرًا لعدم توافر الأشخاص لشَغْل هذه الوظائف. 
- علماء البيانات اليوم هم أساطير الأسواق المالية في الثمانينيات. 

إن استخدام علماء البيانات لا يقتصر على شركات الإنترنت ذات التقنية العالية. فالعديد 

من الشركات التي لا تمتلك الكثير من التواجد على الإنترنت هي أيضًا مهتمة بمتخصصي تحليلات 
البيانات الضخمة المؤهلين تأهيلًا عاليًا. وف ce ll‏ فإن ذلك هو المجال الذي يشهد الكثير 
من النمو. وبالطبع» وكما لوح à JA‏ الكتاب عدة مراتء فإن فرص تنظيم المشاريع لا تزال 
موجودة لتطوير التطبيق التالي «القاتل» والذي من شأنه أن يُحدث فرقًا كيا لإحدى المنظمات 
والمستفيدين منها وبالتالي تجعلك غنيًا ومشهورًا. 


أسئلة مراجعة على V-A eI‏ 

-١‏ ما هو عام البيانات؟ وما سبب زيادة الطلب عليه؟ 

؟- ما هي الخصائص المشتركة لعلماء البيانات؟ وأي من هذه الخصائص يُعد أكثرها أهمية؟ 
*- من أين b‏ علماء البيانات؟ وما هي الخلفيات التعليمية التي لديهم؟ 

-E‏ في رأيك» ما هو الطريق لكي تصبح Úle‏ عظيمًا في البيانات؟ 


vot‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات 


تلخيص لأهم نقاط الفصل: 

- تستطيع البيانات الجغرافية أن تعزز تطبيقات التحليلات عن طريق دمج معلومات المكان. 

- يمكن التنقيب في معلومات موقع المستخدمين الحالي لتطوير الحملات الترويجية التي تستهدف 
مستخدم معين في الوقت المناسب. 

- يمكن استخدام معلومات المكان من أجهزة الجوال لإنشاء ملفات تعريف لس لوك وحركة 
المستخدم. تكن مثل هذه المعلومات الخاصة بمكان المستخدمين من إيجاد أناس آخرين ذوي 
اهتمامات ومعلنين متشابهين لتكييف عروضهم الترويجية. 

- تستطيع Lej]‏ التحليلات المبنية على المكان أن تفيد المستهلكين بشكل مباشر وليس الشركات 
فقط. ويتم تطوير تطبيقات الجوال لتمكين مثل هذه التطبيقات للتحليلات الابتكارية. 

- يعتبر إنترنت الأشياء GoT)‏ المنحنى الأسامي القادم لنمو علم التحليلات / البيانات. ويطلق 
عليه البعض Lal‏ الإنترنت الصناعي. 

- تنمو تطبيقات (101) في كل صناعة Le‏ في ذلك التطبيقات الطبية والتصنيع والطاقة والملاحة الجوية. 

- تعتبر إحدى الفئات الشائعة لتطبيقات (101) هى الصيانة التنبؤية لتخفيض وقت توقف 
المعدات غير الضروري وإجراء الصيانة / الإصلاحات المطلوبة قبل استلزامها. 

- تقدم الحوسبة السحابية إمكانية استخدام البرمجيات والأجهزة والمنصات والبنية التحتيةء dS‏ 
بحسب اشتراكه. كما GSE‏ الحوسبة السحابية المستخدم من استثمار أكثر قابلية للتطوير. 

- تقدم الخدمات التحليلية القائمة على الحوسبة السحابية إلى المنظمات أحدث التقنيات دون 
استثمار معنوي مسبق. 

- تستطيع التحليلات التأثير على المنظمات بطرق كثيرة. كأنظمة مستقلة أو متكاملة فيما بينهاء 
أو مع أنظمة معلومات أخرى قائمة على الحوسبة. 

- يتفاوت تأثير التحليلات على الأفراد. فقد يكون إيجابيًا أو محايدًا أو سلبيًا. 

- قد يصاحب تقديم أنظمة ذكية ظهور QUAS‏ قانونية جديّة. وتعتبر المسؤولية والخصوصية 
is‏ المشاكل المهيمنة. 

- يمكن توقع الكثير من الآثار الاجتماعية الإيجابية من التحليلات» والتي تتراوح من توفير فرص 
للمعاقين إلى قيادة الحرب ضد الإرهاب. ومن المحتمل تحسن جودة الحياة في كل من العمل 
وابمنزلء كنتيجة للتحليلات. وبالطبع يكون هناك blas LAÍ‏ تحتاج للاهتمام. 
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- إن نمو التحليلات سوف يؤدي إلى تغيرات جوهرية في هيكل الصناعة ومستقبل التوظيف. 
- تكمن المعركة الكبرى حول من يمتلك جميع بيانات المستخدم التي يتم إنشاؤها من استعمال 
الهواتف الذكية والسيارات وما إلى ذلك. 


مصطلحات أساسية: 





الحوسبة السحابية نظم المعلومات الجغرافية (GIS)‏ | إنترنت الأشياء (IoT)‏ 








التعريف بترددات الراديو (RFID)‏ الخصوصية | 





أسئلة للمناقشة: 

-١‏ ما هي الفوائد المحتملة من استخدام البيانات الجغرافية المكانية في التحليلات؟ مع ضرب أمثلة. 

-Y‏ ما هي أنواع التطبيقات الجديدة التي يمكن أن تظهر من معرفة المواقع الفورية للمستخدمين؟ 
وماذا لو كنت تعرف Lái‏ ماذا يحملون في سلة تسوقهم Ss‏ 

-P‏ كيف oe‏ أن يستفيد المستهلكون من استخدام التحليلات» لا سيما القائمة منها على معلومات المكان؟ 

-E‏ ناقش العبارة التالية: «يعتبر إنشاء ملفات التعريف القائم على تتبع المكان قويًا ولكنه أيضًا 
يضع تهديدات للخصوصية». 

0- هل تعتبر الحوسبة السحابية «مجرد منتج قديم أعيد تغليفه بعبوة جديدة»؟ وكيف تتشابه 
مع المبادرات الأخرى؟ وكيف تختلف؟ 

3- ناقش العلاقة بين أجهزة الجوال والشبكات الاجتماعية. 

-V‏ يدعي البعض أن التحليلات بشكل عام تفرغ الأنشطة الإدارية من الإنسانيةء ويعترض آخرون 
على هذا الادعاء. ناقش براهين كل من وجهتّي النظر هاتين. 

-A‏ إن تشخيص العدوى ووصف الأدوية هما نقاط ضعف العديد من الأطباء الممارسين (وفقًا ل 
E. H. Shortliffe‏ أحد مطوري (MYCIN‏ ولذ يبدو أنه سيكون من الأفضل للمجتمع 
أن يتم استخدام أنظمة تشخيص مبنية على التحليلات من قبل المزيد من الأطباء. أجب عن 
الأسئلة التالية: 

-١‏ في رأيك BU‏ يتم استخدام Jio‏ هذه الأنظمة بالحد الأدنى من قبل الأطباء؟ 
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-Y‏ افترض dol‏ مدير مستش فى ويتبع لك الأطباء الذين يتقاضون رواتبهم منها. ماذا ستفعل 
لإقناعهم باستخدام النظام؟ 
۴- إذا كانت الفوائد المحتملة للمجتمع عظيمة diy‏ فهل يستطيع هذا المجتمع أن يفعل 
Éd‏ يزيد من استخدام الأطباء لمثل هذه النظم التحليلية؟ 

-A‏ اذكر بعض مخاوف الخصوصية الرئيسة المتعلقة باستخدام التحليلات على بيانات الجوال؟ 

-٠‏ اذكر حالات جديدة للتعديات على خصوصية المستخدم وتأثيراتها على علم البيانات كمهنة. 

تمارين: شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 

- اذهب إلى teradatauniversitynetwork.com‏ وابحث عن دراسات الحالة. قم بمشاهدة 
فيديو 851 عن حالة الركاب الذين تم انقطاع الاتصال بهم والذين قد تكون رأيتهم أثناء قراءة 
الفصل الأول. ما هي التطبيقات الجديدة التي يمكنك تخيلها مستوى البيانات التفصيلية التي 
يمكن لشركات الطيران التقاطها اليوم؟ 

- على «teradatauniversitynetwork.com‏ اذهب إلى مكتبة الحلقات الصوتية. 
قم بإيجاد حلقات صوتية عن ذكاء الأعمال واسعة الانتشار والمقدمة من -Hugh Watson‏ 
قم بتلخيص النقاط المعروضة من قبل المتحدث. 

- اذهب إلى teradatauniversitynetwork.com‏ وابحث عن مقاطع فيديو 851. استعرض 
هذه المقاطع وأجب عن أسئلة الحالة المرتبطة بها. 

- توفر المجموعات المبنية على تتبع المكان احتمال الخدمات الشخصية ولكن يتحدى الخصوصية. قم 
بتقسيم الصف إلى فريقين للتناظر أحدهما «مع» والآخر «ضد» هذه التطبيقات. 

- حدد القضايا الأخلاقية المرتبطة باتخاذ القرارات الإدارية. ابحث على الإنترنت» وانضم إلى مجموعات 
/ المدونات المناقشة» واقرأ المقالات من الإنترنت» ثم قم بإعداد تقرير عن النتائج الخاصة بك. 

- ابحث على الإنترنت لإيجاد أمثلة LASI‏ قيام نظم التحليلات بتسهيل أنشطة مثل التفويض. 
والتخصيص alil‏ والعمل الجماعي. 

- ابحث في مركز موارد التقنية الخاص بجمعية Bar‏ الأمريكية abanet.org/tech/Itrc/techethics.)‏ 
(html‏ وموقع .nolo.com‏ ما هي الاهتمامات القانونية وا مجتمعية الرئيسة والمتقدمة التي تمت 
معالجتها هناك؟ وكيف يتم التعامل معها؟ 
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- قم باستكشاف عدة مواقع مرتبطة بالرعاية الصحية (مثل .(who.intg WebMD.com‏ أوجد 
القضايا المتعلقة بالتحليلات والخصوصيةء ثم اكتب تقريرًا عن الكيفية التي تعمل بها هذه 
المواقع على تحسين الرعاية الصحية. 

- قم بزيارة مدونة IoT Ecosystem‏ الخاصة — Matt Turck‏ على http://mattturck.‏ 
.com/2016/03/28/2016-iot-landscape/‏ حدد على الأقل شركتين فيما لا يقل عن قطاعين 
رأسيين وقطاعين أفقيين. اذهب إلى مواقع الويب الخاصة بهاتين الشركتين وقم بإعداد تقرير 
عن عروضهما ونجاحات العملاء. 

- ادخل على YouTube.com‏ وابحث عن مقاطع فيديو عن الحوسبة السحابيةء وقم مشاهدة 
اثنين على الأقل من هذه المقاطع. unc‏ النتائج الخاصّة بك. 

- ادخل على Pandora.com‏ واكتشف كيف تستطيع إنشاء ومشاركة موسيقى مع الأصدقاء. 
zu‏ ستكشف كيف يحلل ال موقع تفضيلات | لمستخدم. 

- ادخل على Humanyze.com‏ واستعرض دراسات حالة متنوعة وقم بتلخيص أحد التطبيقات 
المثيرة من أجهزة الاستشعار في فهم التبادلات الاجتماعية في المنظمات. 

- يعد الهدف من هذا التمرين هو تعريفك بإمكانيات الهواتف الذكية لتحديد النشاط البشري. 
وتكون مجموعة البيانات متاحة archive.ics.uci.edu/ml/datasets/Human-Activ : Je‏ 
ity - Recognition Using4Smartphones‏ 


- إنها تحتوي على قراءات التسارع وضابط الاتجاهات (البوصلة الدوارة) لثلاثين فردًا يضعون 
الهاتف الذي في حزام يلتف حول وسطهم. تكون البيانات متاحة في صورتها الخام وتتضمن 
بعض جهود تجهيز البيانات. ويكون هدفك هو تحديد وتصنيف هذه القراءات إلى أنشطة 
كالمشي والجري وتسلق الجبالء وما إلى ذلك. ويتوفر المزيد من المعلومات عن مجموعة 
البيانات à‏ صفحة التنزيل. وممكنك استخدام التجميع من أجل الاستكشاف dad‏ واكتساب 
فهم البيانات. كما يمكنك استخدام أدوات مثل R‏ لتجهيز وتحليل هذه البيانات. 
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التحضيرية في جامعة dll‏ سعود. 
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حقوق الطبع والنشر محفوظة لمعهد الإدارة العامة ولا يجوز 


اقتباس جزء من هذا الكتاب أو إعادة طبعه بأية صورة دون 


موافقة كتابية من المعهد إلا في حالات الاقتباس القصير بغرض 
النقد والتحليل» مع وجوب ذكر المصدر. 





تم التصميم والإخراج الفني والطباعة في 


الإدارة العامة للطباعة والنشر - معهد الإدارة العامة EE)‏ 


هذا الكتاب: 
phs‏ مصطلح التحليلات إلى مصطلحات حديثة أخرى مثل علم البيانات» وهو 
أحدث تجسيد qni‏ العميق وإنترنت الأشياء إذ تقوم أغلب المنظمات - سواء خاصة أو 





shidh - dale‏ وحدات تنظيمية جديدة ل على التحليلات التي تدعم plab‏ القرار 





معلوماتيًا وتسهم في رفع كفاءة وفعالية عملياتها؛ وذلك بالاعتماد على آحدث الأدوات 
المعلوماتية الذكية. Jio‏ ذكاء الأعمال والذي يستخلص امعلومات بطريقة مبتكرة مز 
تيارات البيانات Ae gil]‏ 








pii‏ هذا الكتاب منظوراً Ulo‏ لتحليلات الأعمال في LOU‏ فصول تبداً بنظرة عامة 
على ذكاء الأعمال والتحليلات» وعلم البيانات» ثم ينتقل إلى التحليلات الوصفية aig‏ 
طبيعة البيانات» والنمذجة dilay!‏ وتصوير البيانات» وذكاء الأعمال» ومستودعات 





البيانات ومصطلحات doas‏ مثل: بحيرات البيانات» متبوعة بالتحليلات التنبؤية iaig‏ 
عملية وطرق وخوارزميات التنقيب في البيانات» وتحليلات النص والويب ووسائل التواصل 
الاجتماعي» ويليها التحليلات ا مثل الأمثلية ا ثم استعراض المفاهيم 
والأدوات الأساسية للبيانات الضخمة, وينتهي الكتاب c3) sb‏ على الاتجاهات ا مستقبلية 


والخصوصية والاعتبارات الإدارية ف التحليلات. 























bhè ats‏ هذا الكتاب يعد CaL] Co jo‏ للأكادهيين واممهنيين على كافة 
مستوياتهم وتخصصاتهم؛ مما جعله من الكتب الرائدة في السوق. وقد تميّزت هذه الطبعة 
المنقحة من هذا الكتاب بالشمولية والوضوح وسهولة الاستخدام وتقديم مواد دقيقة 
EEE EES SEE aT jS el d B, hse pt d doas‏ 
عام الواقع» مثل أفضل الممارسات لتوظيف الأفراد الأذكياء للأدوات ا لتحسين 
الأداء والعلاقات في منظمات الأعمال والحكومات والمنظمات غر الرّبحية؛ مما ارتقى 
بالكتاب إلى مستوى esil‏ ام معلوماتي للعمل الإداري؛ وبشكل أساسي eio‏ القرار. 








لاما 
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